首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· Pytorch安装(保姆级教学 真·满血·GPU版)CUDA更新?torch版本?一文全搞定!
· LangChain Agent 原理解析
· 无需翻墙,可合法使用的8款国内AI大模型产品
· AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理
· SD入门教程零:应用场景
· 教会AI画汉字(ComfyUI篇)
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 100个最强Ai实用工具精讲 - 拒绝焦虑拥抱Ai
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
关于AI声
音
生
成
的一切(
语
音
+
音
乐+嘴型)
其实声
音
生
成
也有很多革命性的工具,例如高质量的声
音
识别、文字转
成
人声、人声克隆、
音
乐
生
成
,已经能组
成
完整工作流了,其中一些工具甚至已经打包好了,只要下载解压就能用!
声音
开源
网易(TTS)EmotiVoice:开源
语
音
合
成
,支持2000多
音
色
你是否曾经想过,如果你能用一句简单的提示来控制你的
语
音
合
成
器,那该多方便?
EmotiVoice
语音合成
AI+
音
乐|对话 Suno CEO:破圈的
音
乐
生
成
产品是如何诞
生
的?
用户可以通过简单的文本提示进行创作,
生
成
多种
音
乐风格的高质量
音
乐和
语
音
。。
suno
音乐
OpenAI
【
语
音
识别】OpenAI
语
音
力作Whisper
虽然无监督预训练能产
生
高质量的
语
音
表征,但它学不到
语
音
到文本的映射,要学到
语
音
到文本的映射只能靠微调。
语音转文字
whisper
开源
【开源项目】Flow Matching
语
音
合
成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入
语
音
合
成
领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
视频
Wunjo AI: 合
成
和克隆英
语
/俄
语
/中文
语
音
,实时
语
音
识别,深度换脸和唇动合
成
,通过文本提示更改视频,分割和修饰
无论您是钻研
语
音
合
成
、制作 Deepfake 动画、通过文本提示绘制稳定扩散视频还是视频制作,Wunjo AI 都能满足您的需求。
AI语音克隆
实时语音识别
视频
栩栩如
生
,
音
色克隆,Bert-vits2文字转
语
音
打造鬼畜视频实践
BERT的出现对自然
语
言处理领域带来了重大影响,
成
为了许多最新研究和应用的基础。
Bert-vits
语音
生
成
式AI与大
语
言模型的区别
如果它们听起来像是可比的,可能更像是
生
成
模型人工智能对大型模型人工智能,或者可能是
生
成
式
语
言模型对大型
语
言模型。
生成式AI
大语言模型
区别
开源
从声纹模型到
语
音
合
成
:
音
频处理 AI 技术前沿 | 开源专题 No.45
facebookresearch/audiocraft[1] Stars: 16.6k License: MIT AudioCraft 是一个用于
音
频
生
成
的
AudioCraft
音频
打造
音
乐传奇:Suno推出
音
乐
生
成
模型Suno V3,让每个人都能
成
为作曲家
Suno AI全新
音
乐
生
成
模型Suno V3来临,掀起
音
乐界"ChatGPT时刻",人人皆可
成
为作曲家、歌手,瞬间超越自我,打造独一无二
音
乐专辑就在此刻!
suno
歌曲
音乐
开源
生
成
式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的
音
频
生
成
开发框架
然而,
音
频
生
成
领域的进展却相对滞后。
开源模型
RAG
RAG 2.0来了,它能
成
为
生
产落地的福
音
吗?
RAG作为当前最流行、相对
成
熟的的LLM应用架构,受到了开发者的广泛关注,相关围绕RAG优化的技术层出不穷,但依旧难逃达不到
生
产应用要求的尴尬。
RAG
大模型
开源
有感情的
语
音
合
成
开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的
语
音
生
成
模型,专门用于大型
语
言模型(LLM)助手的对话任务、对话
语
音
和视频介绍等应用。
ChatTTS
语音合成
开源
有道开源的国产
语
音
库EmotiVoice爆火了!具有情绪控制功能的
语
音
合
成
引擎!
EmotiVoice 项目介绍 EmotiVoice 是一款现代化的开源
语
音
合
成
引擎,支持中英文双
语
,包含2000多种不同的
音
色,以及特色的情感合
成
功能,支持合
成
包含快乐、兴奋、悲伤、愤怒等广泛情感的
语
音
EmotiVoice
语音库
字正腔圆,万国同
音
,coqui-ai TTS跨
语
种
语
音
克隆,钢铁侠讲16国
语
言
这使得模型能够在不同
语
种之间进行
语
音
合
成
,而无需在任何双
语
或平行示例上进行训练。
coqui-ai
TTS
语音
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100