首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 玩一玩阿里通义千问开源版,Win11 RTX3060本地安装记录
· 超详细的 Stable Diffusion ComfyUI 基础教程(一):安装与常用插件
· 【爆肝整理】500+ AI 最佳提示词
· 40个prompt,让你成为麦肯锡高手
· 超级干货,自学stable diffusion,看完这篇就够了
· 学会这招,一个头像变100种风格!
· SD入门教程三:采样器及参数调整
· 7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OpenAI
【
语
音
识
别
】OpenAI
语
音
力作Whisper
这么多的标注数据使得我们可以直接在 有监督
语
音
识
别
任务上预训练Whisper,从标注
音
频转录数据中直接习得
语
音
到文本的映射。
语音转文字
whisper
OpenAI
OpenAI大动作:Whisper large-v3重塑
语
音
识
别
技术
这款最新的自动
语
音
识
别
模型不仅在多
语
言
识
别
方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
开源
十大开源
语
音
识
别
项目
这项技术在多个领域有着广泛的应用,包括但不限于
语
音
助手、
语
音
搜索、自动转写以及
语
音
命令
识
别
。
语音识别
开源项目
Insanely Fast Whisper:超快的Whisper
语
音
识
别
脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2
语
音
转录模型的超快速能力。
音频
Whisper
开源
开源免费离线
语
音
识
别
神器whisper如何安装
当然,我们知道一些商业公司提供
语
音
识
别
服务,但是基本都是联网运行,个人隐私安全总是有隐患,而whisper完全不同,whisper完全在本地运行,无需联网,充分保障了个人隐私,且whisper
识
别
准确率相当高
wisper
翻译
免费
开源
OpenAI 开源
语
音
识
别
Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自动
语
音
识
别
模型的软件工具,能够将
音
频或视频中的
语
音
自动
识
别
为带有时间戳的文本字幕。
生成式AI
国内厂商
语
音
识
别
与Whisper评测:现状与概况对比
国内的科技企业在
语
音
识
别
领域也在不断迭代和创新,其中不乏一些具有竞争力的
语
音
识
别
技术,如讯飞、百度、阿里巴巴等,这些厂商的技术在一定程度上已经接近或达到了国际领先水平。
语音识别
Faster-Whisper
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识
别
数倍加速
懂技术的小伙伴也可以寻找其他替代方案,比如
语
音
转文字模型 Whisper、文字翻译 GPT、声
音
克隆 + 生成
音
频 so-vits-svc、生成符合
音
频的嘴型视频 GeneFace++dengdeng。
语音
HeyGen
Google
AI“同声传译”新进展!Google发布,无监督,
语
音
识
别
:Translatotron 3!
语
音
识
别
(ASR)是指将人类的
语
音
转换为文本的技术,然而,目前的
语
音
识
别
技术还面临着一些挑战,其中最大的一个就是如何支持更多的
语
言。
Translatotron
语音识别
Python
Whisper对于中文
语
音
识
别
与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的
语
音
做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过
Whisper
语音优化
语
音
识
别
的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了
语
音
识
别
的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
视频
Wunjo AI: 合成和克隆英
语
/俄
语
/中文
语
音
,实时
语
音
识
别
,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰
主要特征
语
音
合成:轻松将文本转换为类似人类的
语
音
。
AI语音克隆
实时语音识别
「
语
音
识
别
的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
在AI技术的浪潮中,一款新型的
语
音
识
别
模型Distil-Whisper以其独特的魅力和强大的性能脱颖而出。
Distil-Whisper
语音识别
「
语
音
转换新速度」— 探秘Whisper JAX的70倍速提升
在AI的众多分支中,
语
音
识
别
技术的突破性进展尤为引人瞩目。
Whisper
语音识别
OCR
【重磅推荐】PaddleOCR:超越人眼
识
别
率的AI文字
识
别
神器!
二、PaddleOCR功能特点 1.高准确率:PaddleOCR的算法经过精心设计和优化,可准确
识
别
不同字体、字号、字形的文字图像,实现超越人眼
识
别
率的准确率。
PaddleOCR
文字识别
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100