首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· Pytorch安装(保姆级教学 真·满血·GPU版)CUDA更新?torch版本?一文全搞定!
· LangChain Agent 原理解析
· 无需翻墙,可合法使用的8款国内AI大模型产品
· AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理
· SD入门教程零:应用场景
· 教会AI画汉字(ComfyUI篇)
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 100个最强Ai实用工具精讲 - 拒绝焦虑拥抱Ai
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OpenAI
【
语
音
识
别
】OpenAI
语
音
力作Whisper
与人类相比,在
语
音
识
别
和
语
音
翻译(x→en)上,模型的准确性和稳健性接近人类。
语音转文字
whisper
OpenAI
OpenAI大动作:Whisper large-v3重塑
语
音
识
别
技术
这款最新的自动
语
音
识
别
模型不仅在多
语
言
识
别
方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
开源
十大开源
语
音
识
别
项目
它在大量多样化的
音
频数据集上进行训练,作为一个多任务模型,可以执行多
语
言
语
音
识
别
、
语
音
翻译和口
语
识
别
。
语音识别
开源项目
实
时
语
音
克隆
项目简介 这份内容介绍了
实
时
语
音
克隆的技术
实
现,作者通过将说话者验证技术转移到多说话人文本到
语
音
合成(SV2TTS)来
实
现
语
音
克隆。
语音
克隆
视频
Wunjo AI: 合成和克隆英
语
/俄
语
/中文
语
音
,
实
时
语
音
识
别
,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰
语
音
克隆:从提供的
音
频文件中克隆
语
音
或直接在应用程序中录制您的声
音
以进行
实
时
克隆。
AI语音克隆
实时语音识别
Insanely Fast Whisper:超快的Whisper
语
音
识
别
脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2
语
音
转录模型的超快速能力。
音频
Whisper
Python
Whisper对于中文
语
音
识
别
与转写中文文本优化的
实
践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但
实
际上,Whisper的使用者完全可以针对中文的
语
音
做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过
Whisper
语音优化
大模型
“
实
时
”
语
音
翻译!AI
语
音
具有“情绪”!最强开源AI大模型来了
它可以
实
现多种
语
音
和文字之间的转换和翻译,而且只需要一个模型,就可以支持近百种
语
言,效果也非常出色。
大模型
开源模型
语音
开源
开源免费离线
语
音
识
别
神器whisper如何安装
当然,我们知道一些商业公司提供
语
音
识
别
服务,但是基本都是联网运行,个人隐私安全总是有隐患,而whisper完全不同,whisper完全在本地运行,无需联网,充分保障了个人隐私,且whisper
识
别
准确率相当高
wisper
翻译
免费
OpenAI
基于 OpenAI Whisper 模型的
实
时
语
音
转文字工具
· WhisperLive 是一款专注于
音
频处理和创作的开源软件,使用 OpenAI Whisper 模型将
语
音
输入转换为文本输出,可以用于转录麦克风的
实
时
音
频输入和预先录制的
音
频文件,为艺术家和
音
乐制作人提供了一个强大的平台
WhisperLive
音频
开源软件
开源
OpenAI 开源
语
音
识
别
Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自动
语
音
识
别
模型的软件工具,能够将
音
频或视频中的
语
音
自动
识
别
为带有
时
间戳的文本字幕。
生成式AI
开源
从 GPT-4o 到 LiveKit:
实
时
语
音
交互的开源
实
现
今天我们来聊聊OpenAI 发布会提到的
实
时
对话
语
音
技术。
GPT-4o
语音交互
国内厂商
语
音
识
别
与Whisper评测:现状与概况对比
同
时
,Whisper(飞思卡尔
语
音
识
别
技术)作为一项国际上也备受关注的
语
音
识
别
技术,在
语
音
识
别
领域也有着广泛的应用。
语音识别
Faster-Whisper
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识
别
数倍加速
前段
时
间,「霉霉大秀中文」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英
语
」等类似视频。
语音
HeyGen
Fastwhisper + Pyannote
实
现 ASR + 说话者
识
别
,因此,如果
实
际业务中需要涉及到不同的
语
言,还是更推荐whisper多一点 一、faster-whisper简单介绍 faster-whisper是使用CTranslate2对OpenAI的
faster-whisper
语者识别
ASR
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100