文章列表-AI魔法学院

文章列表

数字人之声音克隆：无样本，1分钟样本完美克隆声音，开源

零样本文本到语音（TTS）：输入 5 秒的声音样本，即刻体验文本到语音转换。

数字人声音克隆 GPT-SoVITS

神奇的 OuteTTS - 0.1 - 350M：用几秒钟音频克隆声音的黑科技！

在当今数字化时代，文本转语音（TTS）技术的应用愈发广泛，从智能语音助手到有声读物，从无障碍服务到教育娱乐领域，都离不开高质量的语音合成。

OuteTTS-0.1-350M 音频

【开源项目】Flow Matching 语音合成

CFM是一种新技术，已被证明可以改进扩散模型，Meta的Voicebox模型将CFM引入语音合成领域，下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional

音视频 Flow Matching

从声纹模型到语音合成：音频处理 AI 技术前沿 | 开源专题 No.45

· 支持多个 ASR (自动演讲识别) 配方 · 支持类似于 ASR 配方一样的 TTS (文本转声) · 支持 ST (Speech Translation

AudioCraft 音频

13.5K Star ! Fish Speech Windows本地搭建，能否达到官方的级别？强烈推荐

Fish Speech是一款由Fish Audio开发的开源的文本到语音（TTS）工具，支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。

Fish Speech 本地搭建

网易有道强力开源中英双语语音克隆

8501:8501 syq163/emoti-voice:latest 现在打开浏览器，导航到 http://localhost:8501 ，就可以体验EmotiVoice强大的TTS

语音开源

栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践

诸公可知目前最牛逼的TTS免费开源项目是哪一个？

Bert-vits 语音

关于AI声音生成的一切（语音+音乐+嘴型）

audioldm2/ •Amphion：支持多种音频生成任务，包括文本到语音（TTS

声音

GPT-4o实时语音方案提供商Livekit开源voice agent：轻松处理音视频流

STT livekit-plugins-elevenlabs TTS

voice agent 开源音视频

17K star！30秒偷走你的声音，开源声音克隆工具

使用 OpenVoice 项目组说体验OpenVoice最方便的方法是直接使用MyShell中免费的TTS和即时语音克隆服务.

OpenVoice 声音克隆开源

【2023.10】看目前巨头的AI原生产品布局

【OA.2】ChatGPT Voice 按照OpenAI的说法，Voice能力只是简单地在ChatGPT模式上使用了语音识别和一个高质量的TTS。

大模型产品

46.6k星星！最强开源AI集合系统，一键部署全网AI工具都能直接用，UI简直是视觉盛宴！

五、TTS和STT LobeChat 支持文本转语音（TTS）和语音转文本（STT），让用户可以通过语音来回对话，跟目前大多数的应用差不多。

AI开源集合

clone-voice：一键克隆声音，开源AI技术让声音创作更便捷、更个性化

clone-voice 下双击 app.exe ，等待自动打开web窗口，请仔细阅读cmd窗口的文字提示, 如有错误，均会在此显示模型下载后解压到软件目录下的 tts

clone-voice 声音克隆

从 GPT-4o 到 LiveKit：实时语音交互的开源实现

LiveKit 支持语音、视频和数据流处理，内置了自动语音识别（ASR）和文本转语音（TTS）功能，简化了语音到文本和文本到语音的转换过程。

GPT-4o 语音交互

智谱AI静悄悄的上线了一大波新模型，过年了，真的

可以标记，不过可惜的是声音能明显的感觉到是极低延时的TTS，在实时对话中是可以打断的。

智谱AI 大模型

<123 >

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1