首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
· 划重点!全网最全AI数字人工具合集!
· 大模型推理能力增强方法总结
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Kimichat炒股:7个提示词案例
· LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
· 字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
· 我们需要的不是智能体,而是工作流(5000字保姆式教学)
· 神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
· 开源!数字人资源大集合!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
全球最大开源prompt社
区
即将开放中文版
别
人都在用prompt做什么?
开源模型
OpenAI
【语音识
别
】OpenAI语音力作Whisper
与人类相比,在语音识
别
和语音翻译(x→en)上,模型的准确性和稳健性接近人类。
语音转文字
whisper
Transformer
TrOCR——基于transformer模型的OCR手写文字识
别
前期我们使用大量的篇幅介绍了手写数字识
别
与手写文字识
别
,当然那里主要使用的是CNN卷积神经网络,利用CNN卷积神经网络来训练文字识
别
的模型。
OCR
手写
文字识别
教程
openpose原理及安装教程(姿态识
别
)
OpenPose是一个用于实时多人姿态估计的开源库,它可以检测图像或视频中的人体关键点,并且能够识
别
不同的身体部位和动作。
行为识别
姿态识别
Stable Diffusion
Stable Diffusion 和 Midjourney的优劣势比较,如何选择?
③使用难度较低:基本上复制
别
人已有的提示词,选好选项,就能出图。
文生图
语音
Insanely Fast Whisper:超快的Whisper语音识
别
脚本
同时,还提到了Whisper.cpp的性能测试、4位推断性能测试、以及一个CLI工具的社
区
展示。
音频
Whisper
开源
来个优秀的开源人脸识
别
项目!
虹膜识
别
技术通过全自动照相机寻找并聚焦虹膜,实现高精度识
别
。
人脸识别
开源项目
开源
OpenAI 开源语音识
别
Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自动语音识
别
模型的软件工具,能够将音频或视频中的语音自动识
别
为带有时间戳的文本字幕。
生成式AI
开源
人脸识
别
的开源的项目有哪些?
OpenCV:OpenCV(Open Source Computer Vision Library)是一个广泛使用的计算机视觉库,提供了许多人脸识
别
算法和工具。
人脸识别
开源项目
Stable Diffusion
全面理解Stable Diffusion采样器
他们之间的
区
别
是什么?
绘画
采样器
SD
开源
[开源]面向中小团队的轻量化知识管理应用,构建知识库和知识社
区
使用BSD-3-Clause开源协议 三、界面展示 产品截图 四、功能概述 “知了”以知识管理的全生命周期为核心,围绕知识的分享再利用,构建中小团队的知识库和知识分享社
区
,
大模型
开源
几款开源的OCR识
别
项目,收藏备用
github.com/PaddlePaddle/PaddleOCR.git EasyOCR EasyOCR是用Python编写基于Tesseract的OCR识
别
库
OCR
开源
开源免费离线语音识
别
神器whisper如何安装
当然,我们知道一些商业公司提供语音识
别
服务,但是基本都是联网运行,个人隐私安全总是有隐患,而whisper完全不同,whisper完全在本地运行,无需联网,充分保障了个人隐私,且whisper识
别
准确率相当高
wisper
翻译
免费
OCR
14.6K star!最好用的OCR文字识
别
项目,没有之一!
伙伴们,平时都会用到文字识
别
吧?
Umi-OCR
开源项目
文字识别
Google
AI“同声传译”新进展!Google发布,无监督,语音识
别
:Translatotron 3!
语音识
别
(ASR)是指将人类的语音转换为文本的技术,然而,目前的语音识
别
技术还面临着一些挑战,其中最大的一个就是如何支持更多的语言。
Translatotron
语音识别
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100