首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· 包阅AI-免费AI阅读翻译神器!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型评测新思路:弱智吧精华问题大全
· 精通结构化提示词:如何精确操控指令的作用域与优先级
· 小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
· LangChain手册(Python版)11模块:提示模板
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
网易(TTS)EmotiVoice:开源
语
音
合成,支持2000多
音
色
你是否曾经想过,如果你能用一句简单的提示来控制你的
语
音
合成器,那该多方便?
EmotiVoice
语音合成
字正腔圆,万国同
音
,coqui-ai TTS跨
语
种
语
音
克隆,钢铁侠讲16国
语
言
按照固有的思维方式,如果想要
语
音
克隆首先得有克隆对象具体的
语
言
语
音
样本,换句话说,克隆对象必须说过某一种
语
言的话才行,但现在,coqui-ai TTS V2.0版本做到了,真正的跨
语
种无需训练的
语
音
克隆技术
coqui-ai
TTS
语音
开源
语
音
、视频转文字神器:开源whisper介绍
OpenAI的Whisper是一种基于深度学习的
语
音
识
别
模型,它是一种通用的
语
音
识
别
模型,可以用于
语
音
识
别
、
语
音
翻译和
语
言
识
别
等任务。
人工智能
大模型
wisper
工具
AI文本转
语
音
工具(TTS):MeloTTS
今天给大家介绍一个效果不错的开源文本转
语
音
工具:MeloTTS MeloTTS是一个可以把文字转换成声
音
的工具,它支持英
语
、西班牙
语
、法
语
、中文、日
语
和韩
语
等多种
语
言。
MeloTTS
语音工具
微调
大
语
言模型综述<演进,技术路线,区
别
,微调,
实
践,潜在问题与讨论>
下面是一些基于ChatGLM衍生出来的大模型应用: langchain-ChatGLM:基于 langchain 的 ChatGLM 应用,
实
现基于可扩展知
识
库的问答。
大模型
Transformer
TrOCR——基于transformer模型的OCR手写文字
识
别
前期我们使用大量的篇幅介绍了手写数字
识
别
与手写文字
识
别
,当然那里主要使用的是CNN卷积神经网络,利用CNN卷积神经网络来训练文字
识
别
的模型。
OCR
手写
文字识别
教程
openpose原理及安装教程(姿态
识
别
)
OpenPose是一个用于
实
时
多人姿态估计的开源库,它可以检测图像或视频中的人体关键点,并且能够
识
别
不同的身体部位和动作。
行为识别
姿态识别
开源
来个优秀的开源人脸
识
别
项目!
指纹
识
别
技术具有
实
用性强、采集和使用方便等优点。
人脸识别
开源项目
开源
F5-TTS:上海交大开源超逼真声
音
克隆TTS,告
别
ElevenLabs,以后就用它了!
实
测真的很牛
只是
别
被缅北拿去就好。
F5-TTS
音频克隆
开源
人脸
识
别
的开源的项目有哪些?
OpenCV:OpenCV(Open Source Computer Vision Library)是一个广泛使用的计算机视觉库,提供了许多人脸
识
别
算法和工具。
人脸识别
开源项目
ChatGPT
把ChatGPT装进二次元手办,你来吗?AI桌面机器人众筹
接了
语
音
模型模块,可以
实
现丝滑的大模型对话聊天功能。
ai小车
esp32
开源
OCR
14.6K star!最好用的OCR文字
识
别
项目,没有之一!
伙伴们,平
时
都会用到文字
识
别
吧?
Umi-OCR
开源项目
文字识别
开源
几款开源的OCR
识
别
项目,收藏备用
tesseract Tesseract,一款由HP
实
验室开发由Google维护的开源OCR引擎,开源,免费,支持多
语
言,多平台; https://github.com/tesseract-ocr
OCR
开源
【
语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+
实
战部署推理!
整体项目的框架如下: 核心模型一:
语
音
识
别
模型SenseVoice介绍 SenseVoice 是一个全面的
语
音
基础模型,旨在执行各种
语
音
理解任务,包括自动
语
音
识
别
(ASR)、
语
言
识
别
asr
tts
声音
语
音
克隆又又又又又升级了
,
时
隔几个月Meta又推出了最新的
语
音
生成技术,不仅能可能声
音
,还能通过对声
音
的描述来生成独特的
音
色,同
时
还能通过描述来生成各种各样的
音
效,甚至能通过文字描述来编辑声
音
,整体来说,这项技术几乎囊括了现在人们对
语
音
生成技术的所有的需求
Meta
语音生成
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100