首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
开源免费离线语音
识
别
神器whisper如何安装
当然,我们知道一些商业公司提供语音
识
别
服务,但是基本都是联网运行,个人隐私安全总是有隐患,而whisper完全不同,whisper完全在本地运行,无需联网,充分保障了个人隐私,且whisper
识
别
准确率相当高
wisper
翻译
免费
OCR
14.6K star!最好用的OCR文字
识
别
项目,没有之一!
伙伴们,平时都会用到文字
识
别
吧?
Umi-OCR
开源项目
文字识别
开源
几款开源的OCR
识
别
项目,收藏备用
github.com/PaddlePaddle/PaddleOCR.git EasyOCR EasyOCR是用Python编写基于Tesseract的OCR
识
别
库
OCR
一文彻底搞懂多模
态
- 多模
态
推理
多模
态
推理 多模
态
推理涉及至少两种不同的感知模
态
,最常见的是视觉和语言。
多模态推理
大模型
工具
OCRmyPDF—可智能
识
别
PDF文本和图片信息的工具
如果需要,可以在执行OCR之前对图像进行纠偏和/或清洁 •验证输入和输出文件 •在所有可用的CPU核心之间分配工作 •使用Tesseract OCR引擎
识
别
超过
OCRmyPDF
工具
Google
AI“同声传译”新进展!Google发布,无监督,语音
识
别
:Translatotron 3!
语音
识
别
(ASR)是指将人类的语音转换为文本的技术,然而,目前的语音
识
别
技术还面临着一些挑战,其中最大的一个就是如何支持更多的语言。
Translatotron
语音识别
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音
识
别
数倍加速
Whisper 是 OpenAI 研发并开源的一个自动语音
识
别
(ASR,Automatic Speech Recognition)模型,他们通过从网络上收集了 68 万小时的多语言(
语音
HeyGen
语音
语音
识
别
的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了语音
识
别
的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
开源
OCR是什么以及推荐几款开源中文OCR
识
别
软件
光学字符
识
别
(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析
识
别
处理,获取文字及版面信息的过程。
OCR
语音
「语音
识
别
的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
在AI技术的浪潮中,一款新型的语音
识
别
模型Distil-Whisper以其独特的魅力和强大的性能脱颖而出。
Distil-Whisper
语音识别
语音
国内厂商语音
识
别
与Whisper评测:现状与概况对比
同时,Whisper(飞思卡尔语音
识
别
技术)作为一项国际上也备受关注的语音
识
别
技术,在语音
识
别
领域也有着广泛的应用。
语音识别
Faster-Whisper
OCR
Windrecorder:连续记录屏幕内容,通过OCR技术
识
别
记录内容
它的所有能力(录制、
识
别
处理、存储回溯等)完全运行在本地,无需联网,不上传任何数据,只做应该做的事。
Windrecorder
录屏
语音
Whisper对于中文语音
识
别
与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形
态
可能在中文领域斗不过
Whisper
语音优化
探秘制作艺术二维码的新
姿
势
在之前的文章《AI制作艺术二维码-文生图》中,我介绍了一种直接通过提示词生成高逼格二维码的方法,但是通过提示词我们无法很好的控制生成图片的样式,特
别
是有些同学想要将自己的Logo或者头像附加到二维码中,
图像文字
语音
「语音转换新速度」— 探秘Whisper JAX的70倍速提升
在AI的众多分支中,语音
识
别
技术的突破性进展尤为引人瞩目。
Whisper
语音识别
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100