文章列表-AI魔法学院

创作魔法绘画魔法视频魔法训练魔法 Ai术语

AI魔法学院客服

最新排序收藏

全部

七天内一个月内

选择分类

全部写作魔法绘画魔法视频魔法训练魔法其他 AI工具 VIP视频

推荐阅读换一批

· MCP服务介绍及应用场景报告-来自Manus

· 理解 o3 及其技术分析

· 这个数字人开源项目太牛了，非常全面的项目解决方案(含源码)

· 揭秘数字人困境：代理商亏钱、直播屡被封、刘润也不用了

· AI 爆文写作：如何用GPT写出10万＋？这篇五千字长文给你答案

· 变天了，AI可以一键生成中文海报了......

· 【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比，等你来评!

· 13.5K Star ! Fish Speech Windows本地搭建，能否达到官方的级别？强烈推荐

热门标签

Stable Diffusion stable diffusion Midjourney midjourney ComfyUI comfyui ChatGPT chatgpt 大模型数字人开源人工智能 Sora 文心一言天工零一万物知海图星火文心一格混元通义千问盘古言犀 ChatGLM Github 微软

热门标签

免费教程插件免费教程插件免费教程插件

文章列表

数字人之声音克隆：无样本，1分钟样本完美克隆声音，开源

零样本文本到语音（TTS）：输入 5 秒的声音样本，即刻体验文本到语音转换。

数字人声音克隆 GPT-SoVITS

神奇的 OuteTTS - 0.1 - 350M：用几秒钟音频克隆声音的黑科技！

在当今数字化时代，文本转语音（TTS）技术的应用愈发广泛，从智能语音助手到有声读物，从无障碍服务到教育娱乐领域，都离不开高质量的语音合成。

OuteTTS-0.1-350M 音频

【开源项目】Flow Matching 语音合成

CFM是一种新技术，已被证明可以改进扩散模型，Meta的Voicebox模型将CFM引入语音合成领域，下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional

音视频 Flow Matching

从声纹模型到语音合成：音频处理 AI 技术前沿 | 开源专题 No.45

· 支持多个 ASR (自动演讲识别) 配方 · 支持类似于 ASR 配方一样的 TTS (文本转声) · 支持 ST (Speech Translation

AudioCraft 音频

13.5K Star ! Fish Speech Windows本地搭建，能否达到官方的级别？强烈推荐

Fish Speech是一款由Fish Audio开发的开源的文本到语音（TTS）工具，支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。

Fish Speech 本地搭建

网易有道强力开源中英双语语音克隆

8501:8501 syq163/emoti-voice:latest 现在打开浏览器，导航到 http://localhost:8501 ，就可以体验EmotiVoice强大的TTS

栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践

诸公可知目前最牛逼的TTS免费开源项目是哪一个？

Bert-vits 语音

关于AI声音生成的一切（语音+音乐+嘴型）

audioldm2/ •Amphion：支持多种音频生成任务，包括文本到语音（TTS

GPT-4o实时语音方案提供商Livekit开源voice agent：轻松处理音视频流

STT livekit-plugins-elevenlabs TTS

voice agent 开源音视频

17K star！30秒偷走你的声音，开源声音克隆工具

使用 OpenVoice 项目组说体验OpenVoice最方便的方法是直接使用MyShell中免费的TTS和即时语音克隆服务.

OpenVoice 声音克隆开源

【2023.10】看目前巨头的AI原生产品布局

【OA.2】ChatGPT Voice 按照OpenAI的说法，Voice能力只是简单地在ChatGPT模式上使用了语音识别和一个高质量的TTS。

大模型产品

46.6k星星！最强开源AI集合系统，一键部署全网AI工具都能直接用，UI简直是视觉盛宴！

五、TTS和STT LobeChat 支持文本转语音（TTS）和语音转文本（STT），让用户可以通过语音来回对话，跟目前大多数的应用差不多。

clone-voice：一键克隆声音，开源AI技术让声音创作更便捷、更个性化

clone-voice 下双击 app.exe ，等待自动打开web窗口，请仔细阅读cmd窗口的文字提示, 如有错误，均会在此显示模型下载后解压到软件目录下的 tts

clone-voice 声音克隆

从 GPT-4o 到 LiveKit：实时语音交互的开源实现

LiveKit 支持语音、视频和数据流处理，内置了自动语音识别（ASR）和文本转语音（TTS）功能，简化了语音到文本和文本到语音的转换过程。

GPT-4o 语音交互

智谱AI静悄悄的上线了一大波新模型，过年了，真的

可以标记，不过可惜的是声音能明显的感觉到是极低延时的TTS，在实时对话中是可以打断的。

智谱AI 大模型

1 2 4 5 6 7 8 9 100

skillup 汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1

Ai助理

Hello 👏🏻

我是 Ai助理，关于ai的问题你可以问我

北京天气怎么样啊

明天北京的天气预报还没更新，请您稍等一下，我帮您查一下。明天北京的天气预报还没更新，请您稍等一下，我帮您查一下。

表头	表头	表头	表头	表头	表头
内容	内容	内容	内容	内容	内容
内容	内容	内容	内容	内容	内容
内容	内容	内容	内容	内容	内容

试着问问

How can I get access to post?How can I get

How can I get access to post?How can I get