文章列表-AI魔法学院

文章列表

clone-voice：一键克隆声音，开源AI技术让声音创作更便捷、更个性化

声码器的作用是将模型生成的语音特征还原为可听的声音信号，通过这一步骤，最终生成与原始声音高度相似的克隆语音，实现声音克隆的效果。

clone-voice 声音克隆

字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言

按照固有的思维方式，如果想要语音克隆首先得有克隆对象具体的语言语音样本，换句话说，克隆对象必须说过某一种语言的话才行，但现在，coqui-ai TTS V2.0版本做到了，真正的跨语种无需训练的语音克隆技术

coqui-ai TTS 语音

AI声音克隆 | 最全最简教程（权威版）

它是一种将文本内容转换为语音的技术，通过TTS技术，计算机可以将文字信息转换成人类可听懂的语音输出，实现语音合成的功能目前市场上的AI声音我们最多用的还是普通的

声音克隆教程

网易（TTS）EmotiVoice：开源语音合成，支持2000多音色

你是否曾经想过，如果你能用自己喜欢的声音来朗读任何文本，那该多好？

EmotiVoice 语音合成

剪映克隆声音功能详解：剪映上线5秒“AI克隆音色”，一堆AI公司又要进入慢性死亡了...

我慌的是：AI声音这个赛道的创业者。

剪映声音克隆

懒人福音！用AI生成会议纪要，让你的工作更高效！

下面我会把已经在用的流程和经验分享给大家，包括语音转文本工具的用法，AI总结会议的提示词等等。

会议纪要 AI工具

神奇的 OuteTTS - 0.1 - 350M：用几秒钟音频克隆声音的黑科技！

在当今数字化时代，文本转语音（TTS）技术的应用愈发广泛，从智能语音助手到有声读物，从无障碍服务到教育娱乐领域，都离不开高质量的语音合成。

OuteTTS-0.1-350M 音频

一款构建AI数字人项目开源了！自动实现音视频同步！

1、Video-Tetalking Video-ReTalking 是一个利用AI实现视频人物嘴型与输入的声音同步的创新技术。

AI数字人音视频同步

17K star！30秒偷走你的声音，开源声音克隆工具

现在的AI发展越来越快，生成一段语音不是难事，那如果生成的是你自己的声音？

OpenVoice 声音克隆开源

栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践

语音素材和模型首先我们需要渣渣辉和刘青云的原版音频素材，原版《扫毒》素材可以参考：https://www.bilibili.com/video/BV1R64y1F7SQ/。

Bert-vits 语音

除了深度换脸、模拟配音，还能口型匹配的AI软件出现了

Captions：利用 AI 轻松实现视频翻译本地化 Captions以制作AI生成的字幕、语音纠正以及在后期制作中纠正视频创作者眼球位置的技术而闻名。

AI

FFmpeg之父新作——音频压缩工具 TSAC

其原理和我们之前介绍的突破压缩极限的AI语音编解码器类似，使用深度学习网络进行压缩，TSAC这里引入Transformer结构来提升性能。

TSAC 音频工具

Wunjo AI: 合成和克隆英语/俄语/中文语音,实时语音识别,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰

无论您是钻研语音合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散视频还是视频制作，Wunjo AI 都能满足您的需求。

AI语音克隆实时语音识别

AI“同声传译”新进展！Google发布，无监督，语音识别：Translatotron 3！

语音识别（ASR）是指将人类的语音转换为文本的技术，然而，目前的语音识别技术还面临着一些挑战，其中最大的一个就是如何支持更多的语言。

Translatotron 语音识别

通过声音生成逼真的全身形象？！Meta开源AI工具：audio2photoreal

这是一个由Facebook研究院开发的技术，可以根据音频生成逼真的人物视频！

audio2photoreal 开源工具

<123 4 5 6 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1