首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 2023年人工智能行业总结
· GitHub狂飙3万star的LLM公开资料 - 大模型入门教程
· 各个语种互相翻译:Meta推出NLLB-200 AI模型,可实现200种语言互译
· AI领域的agent是什么意思?
· 「长文」可能是目前最全的LangChain AI资源库之一
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
· 它来了!SDXL + ControlNet 终于强强联合!
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· 如何将 GPT 幻觉发生率从 20% 以上降低到 2% 以下
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
OCR的终极解法——传统算法VS多模态大模型
传统算法 一般情况 OCR
识
别
商务名片会分为两步: · OCR 算法
识
别
出
文
字
和坐标
OCR
大模型
文字识别
开源
人脸
识
别
的开源的项目有哪些?
OpenCV:OpenCV(Open Source Computer Vision Library)是一个广泛使用的计算机视觉库,提供了许多人脸
识
别
算法和工具。
人脸识别
开源项目
开源
OpenAI 开源语音
识
别
Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自动语音
识
别
模型的软件工具,能够将音频或视频中的语音自动
识
别
为带有时间戳的
文
本
字
幕。
生成式AI
开源
开源免费离线语音
识
别
神器whisper如何安装
whisper的日常用途 whisper的核心功能语音
识
别
,对于学生党和工作党来说,可以帮助我们更快捷的将会议、讲座、课堂录音整理成
文
字
稿;对于影视爱好者,可以将无
字
幕的资源自动生成
字
幕,不用再苦苦等待各大
字
幕组的
字
幕资源
wisper
翻译
免费
开源
几款开源的OCR
识
别
项目,收藏备用
,用于图像
识
别
输出
文
本,目前支持80多种语言。
OCR
开源
中
文
开源OCR框架对比及介绍
从严格定义来看,学
字
符
识
别
(Optical Character Recognition, OCR)是指对
文
本资料的图像
文
件进行分析
识
别
处理,获取
文
字
及版面信息的过程。
OCR
OCR
Selenium+ddddocr | 再也不担心图片验证码
)库,该库可以
识
别
图片中的
文
字
,并返回
文
字
内容。
Selenium
ddddocr库
一
文
带你认
识
ELMo
其他几个贡献: 使用
字
符级
别
的CNN表示。
embedding
Google
AI“同声传译”新进展!Google发布,无监督,语音
识
别
:Translatotron 3!
语音
识
别
(ASR)是指将人类的语音转换为
文
本的技术,然而,目前的语音
识
别
技术还面临着一些挑战,其中最大的一个就是如何支持更多的语言。
Translatotron
语音识别
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音
识
别
数倍加速
懂技术的小伙伴也可以寻找其他替代方案,比如语音转
文
字
模型 Whisper、
文
字
翻译 GPT、声音克隆 + 生成音频 so-vits-svc、生成符合音频的嘴型视频 GeneFace++dengdeng。
语音
HeyGen
语音
语音
识
别
的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了语音
识
别
的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
语音
「语音
识
别
的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
在AI技术的浪潮中,一款新型的语音
识
别
模型Distil-Whisper以其独特的魅力和强大的性能脱颖而出。
Distil-Whisper
语音识别
语音
国内厂商语音
识
别
与Whisper评测:现状与概况对比
本
文
旨在通过对国内几家主要厂商的语音
识
别
技术与 Whisper 技术进行评测和对比,以期更全面地了解国内语音
识
别
技术的现状与概况。
语音识别
Faster-Whisper
OCR
Windrecorder:连续记录屏幕内容,通过OCR技术
识
别
记录内容
它的所有能力(录制、
识
别
处理、存储回溯等)完全运行在本地,无需联网,不上传任何数据,只做应该做的事。
Windrecorder
录屏
视频
Wunjo AI: 合成和克隆英语/俄语/中
文
语音,实时语音
识
别
,深度换脸和唇动合成,通过
文
本提示更改视频,分割和修饰
实时语音
识
别
:听写
文
本并获得即时转录。
AI语音克隆
实时语音识别
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100