首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· 大模型狂飙两年后,“六小龙”开始做减法
· ChatGPT写论文指令全集
· 微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
· AI绘画:InstantID Win11本地安装记录!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
· 通俗解读大模型微调(Fine Tuning)
· RAG检索增强技术在知识库智能检索场景下的应用实践
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Fastwhisper + Pyannote 实现 ASR + 说话
者
识
别
ASR相关的业务,也是调研了不少模型,踩了不少坑,ASR这块,目前中文普通话效果最好的应该是阿里的modelscope上的中文模型了,英文的话,还是非whisper莫属了,而且whisper很变态,粤
语
效果也还不错
faster-whisper
语者识别
ASR
OpenAI
【
语
音
识
别
】OpenAI
语
音力作Whisper
与人类相比,在
语
音
识
别
和
语
音翻译(x→en)上,模型的准确性和稳健性接近人类。
语音转文字
whisper
OpenAI
OpenAI大动作:Whisper large-v3重塑
语
音
识
别
技术
这款最新的自动
语
音
识
别
模型不仅在多
语
言
识
别
方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
开源
十大开源
语
音
识
别
项目
它在大量多样化的音频数据集上进行训练,作为一个多任务模型,可以执行多
语
言
语
音
识
别
、
语
音翻译和口
语
识
别
。
语音识别
开源项目
Insanely Fast Whisper:超快的Whisper
语
音
识
别
脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2
语
音转录模型的超快速能力。
音频
Whisper
开源
开源免费离线
语
音
识
别
神器whisper如何安装
whisper的日常用途 whisper的核心功能
语
音
识
别
,对于学生党和工作党来说,可以帮助我们更快捷的将会议、讲座、课堂录音整理成文字稿;对于影视爱好
者
,可以将无字幕的资源自动生成字幕,不用再苦苦等待各大字幕组的字幕资源
wisper
翻译
免费
开源
OpenAI 开源
语
音
识
别
Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自动
语
音
识
别
模型的软件工具,能够将音频或视频中的
语
音自动
识
别
为带有时间戳的文本字幕。
生成式AI
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识
别
数倍加速
Whisper 是 OpenAI 研发并开源的一个自动
语
音
识
别
(ASR,Automatic Speech Recognition)模型,他们通过从网络上收集了 68 万小时的多
语
言(
语音
HeyGen
国内厂商
语
音
识
别
与Whisper评测:现状与概况对比
同时,Whisper(飞思卡尔
语
音
识
别
技术)作为一项国际上也备受关注的
语
音
识
别
技术,在
语
音
识
别
领域也有着广泛的应用。
语音识别
Faster-Whisper
Google
AI“同声传译”新进展!Google发布,无监督,
语
音
识
别
:Translatotron 3!
语
音
识
别
(ASR)是指将人类的
语
音转换为文本的技术,然而,目前的
语
音
识
别
技术还面临着一些挑战,其中最大的一个就是如何支持更多的
语
言。
Translatotron
语音识别
语
音
识
别
的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了
语
音
识
别
的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
OCR
【重磅推荐】PaddleOCR:超越人眼
识
别
率的AI文字
识
别
神器!
二、PaddleOCR功能特点 1.高准确率:PaddleOCR的算法经过精心设计和优化,可准确
识
别
不同字体、字号、字形的文字图像,实现超越人眼
识
别
率的准确率。
PaddleOCR
文字识别
「
语
音
识
别
的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
在AI技术的浪潮中,一款新型的
语
音
识
别
模型Distil-Whisper以其独特的魅力和强大的性能脱颖而出。
Distil-Whisper
语音识别
Python
Whisper对于中文
语
音
识
别
与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用
者
完全可以针对中文的
语
音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过
Whisper
语音优化
动作
识
别
模型有哪些
TWO STREAM方法 Two-Stream方法是深度学习在动作
识
别
方向的一大主流方向。
动作识别
模型
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100