首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· AI声音克隆 | 最全最简教程(权威版)
· ComfyUI官方使用手册【官网直译+关键补充】
· Coze多智能体(Multi-Agents)模式体验!
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· Stable Diffusion 30分钟打造AI 写真照片生成器|海马体照相馆这次真的要木得了
· 从第一性原理看大模型Agent技术
· 精通百种语言的翻译AI来了!Meta推出,免费、开源!
· 6个最佳开源TTS引擎
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
来个优秀的开源人脸
识
别
项目!
虹膜
识
别
技术通过全自
动
照相机寻找并聚焦虹膜,实现高精度
识
别
。
人脸识别
开源项目
开源
几款开源的OCR
识
别
项目,收藏备用
github.com/PaddlePaddle/PaddleOCR.git EasyOCR EasyOCR是用Python编写基于Tesseract的OCR
识
别
库
OCR
开源
OpenAI 开源语音
识
别
Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自
动
语音
识
别
模型的软件工具,能够将音频或视频中的语音自
动
识
别
为带有时间戳的文本字幕。
生成式AI
工具
全球六大主流自
动
PPT制
作
工具
无需设计经验,只需输入内容,Decktopus会自
动
完成剩下的工
作
。
自动PPT
工具
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音
识
别
数倍加速
好在,这并不是唯一的制
作
方法。
语音
HeyGen
工具
动
画制
作
工具AnimateDiff用法详解
AnimateDiff 如何工
作
?
AnimateDiff
视频
训练
工具
OCRmyPDF—可智能
识
别
PDF文本和图片信息的工具
•在所有可用的CPU核心之间分配工
作
•使用Tesseract OCR引擎
识
别
超过100种语言 •保护您的私人数据安全。
OCRmyPDF
工具
ChatGPT
一个完整Prompt让ChatGPT自
动
生成短视频制
作
脚本
你的想法很多,掌握各种网络流行梗,拥有短视频平台时尚、服饰、食品、美妆等领域的相关知
识
储备;能把这些专业背景知
识
融合到对应的短视频脚本创
作
需求中来;根据用户输入的主题创
作
需求[PROMPT],进行短视频脚本创
作
ChatGPT
Prompt
视频
Google
AI“同声传译”新进展!Google发布,无监督,语音
识
别
:Translatotron 3!
语音
识
别
(ASR)是指将人类的语音转换为文本的技术,然而,目前的语音
识
别
技术还面临着一些挑战,其中最大的一个就是如何支持更多的语言。
Translatotron
语音识别
开源
【开源看AI】4.2K star!Reor:AI自
动
帮你发现知
识
之间的连接
不过Quivr侧重的是将你已有的、很大可能是从其他地方得来的知
识
文档(比如PDF、 Word等)汇总成不同主题的Brain,这个汇总的过程是手
动
的,需要用户自己介入的。
Reor
开源工具
知识管理
视频
Wunjo AI: 合成和克隆英语/俄语/中文语音,实时语音
识
别
,深度换脸和唇
动
合成,通过文本提示更改视频,分割和修饰
无论您是钻研语音合成、制
作
Deepfake
动
画、通过文本提示绘制稳定扩散视频还是视频制
作
,Wunjo AI 都能满足您的需求。
AI语音克隆
实时语音识别
语音
国内厂商语音
识
别
与Whisper评测:现状与概况对比
语音
识
别
技术不仅可以应用于智能助手、语音控制、自
动
化客服等领域,还有望为残障人士提供更便捷的沟通工具。
语音识别
Faster-Whisper
语音
语音
识
别
的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了语音
识
别
的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
开源
OCR是什么以及推荐几款开源中文OCR
识
别
软件
光学字符
识
别
(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析
识
别
处理,获取文字及版面信息的过程。
OCR
语音
「语音
识
别
的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
在AI技术的浪潮中,一款新型的语音
识
别
模型Distil-Whisper以其独特的魅力和强大的性能脱颖而出。
Distil-Whisper
语音识别
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100