首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 一文汇总市面上所有prompts提示词框架!
· Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 盘点字节跳动最新的AI应用
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 一条价值2W的Prompt,帮你生成提示词的超级提示词
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
对话式
TTS
: ChatTTS针对对话式任务进行了优化,实现了自然流畅的语音合成,同时支持多说话人。
chattts
tts
文生语音
神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
在当今数字化时代,文本转语音(
TTS
)技术的应用愈发广泛,从智能语音助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的语音合成。
OuteTTS-0.1-350M
音频
开源
【开源项目】Flow Matching 语音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语音合成领域,下面是voicebox的一个工作流程图 Matcha-
TTS
是第一个开源conditional
音视频
Flow
Matching
开源
从声纹模型到语音合成:音频处理 AI 技术前沿 | 开源专题 No.45
· 支持多个 ASR (自动演讲识别) 配方 · 支持类似于 ASR 配方一样的
TTS
(文本转声) · 支持 ST (Speech Translation
AudioCraft
音频
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
Fish Speech是一款由Fish Audio开发的开源的文本到语音(
TTS
)工具,支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。
Fish
Speech
本地搭建
开源
网易有道强力开源中英双语语音克隆
8501:8501 syq163/emoti-voice:latest 现在打开浏览器,导航到 http://localhost:8501 ,就可以体验EmotiVoice强大的
TTS
语音
开源
视频
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践
诸公可知目前最牛逼的
TTS
免费开源项目是哪一个?
Bert-vits
语音
语音
关于AI声音生成的一切(语音+音乐+嘴型)
audioldm2/ •Amphion:支持多种音频生成任务,包括文本到语音(
TTS
声音
开源
17K star!30秒偷走你的声音,开源声音克隆工具
使用 OpenVoice 项目组说体验OpenVoice最方便的方法是直接使用MyShell中免费的
TTS
和即时语音克隆服务.
OpenVoice
声音克隆
开源
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视频流
STT livekit-plugins-elevenlabs
TTS
voice
agent
开源
音视频
【2023.10】看目前巨头的AI原生产品布局
【OA.2】ChatGPT Voice 按照OpenAI的说法,Voice能力只是简单地在ChatGPT模式上使用了语音识别和一个高质量的
TTS
。
大模型
产品
开源
46.6k星星!最强开源AI集合系统,一键部署全网AI工具都能直接用,UI简直是视觉盛宴!
五、
TTS
和STT LobeChat 支持文本转语音(
TTS
)和语音转文本(STT),让用户可以通过语音来回对话,跟目前大多数的应用差不多。
AI开源
集合
开源
从 GPT-4o 到 LiveKit:实时语音交互的开源实现
LiveKit 支持语音、视频和数据流处理,内置了自动语音识别(ASR)和文本转语音(
TTS
)功能,简化了语音到文本和文本到语音的转换过程。
GPT-4o
语音交互
智谱AI静悄悄的上线了一大波新模型,过年了,真的
可以标记,不过可惜的是声音能明显的感觉到是极低延时的
TTS
,在实时对话中是可以打断的。
智谱AI
大模型
语音
GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装
端到端语音处理:与许多依赖于单独的文本到语音 (
TTS
) 或语音到文本 (STT) 模块的模型不同,GLM-4-Voice 直接以口语形式进行解读和响应
GLM-4-Voice
9B
语音
安装
<
1
2
3
>
1
2
4
5
6
7
8
9
100