AI魔法学院客服
17K star!30秒偷走你的声音,开源声音克隆工具
OpenVoice是由openshell开源的一款先进的声音克隆工具,仅需30秒音频样本即可克隆独特音色,并支持多语言、精细控制音色参数。提供在线服务和本地部署选项,目标用户为开发者和研究人员。虽非完美产品,但代表了开源语音克隆技术的最新进展。
 2024-07-24
收藏 复制地址分享海报

现在的AI发展越来越快,生成一段语音不是难事,那如果生成的是你自己的声音?

今天我们分享一款开源的声音克隆工具,只需30秒的一般音源,它就可以偷走你的声音,它就是:OpenVoice

OpenVoice是什么

OpenVoice 是由AI 创业公司 openshell 开源的一款声音克隆工具。OpenVoice 只需要来自目标说话者的简短音频样本即可准确复制其独特的声调和特征。然后,它可以生成听起来自然的语音,以多种语言模仿该语音,同时为用户提供对情感、口音、节奏和语调等参数的精细控制。

用户只需要提供一段大约30秒的音频样本,可以是任何人的声音,然后系统会通过深度学习技术对音频进行分析和处理,精确地克隆出原声音。

OpenVoice 的优势有三个方面:

1. 准确的音色克隆。 OpenVoice 可以准确克隆参考音色并生成多种语言和口音的语音。

2.灵活的音色控制。 OpenVoice 可以对语音风格(例如情感和口音)以及其他风格参数(包括节奏、停顿和语调)进行精细控制。

3.零样本跨语言语音克隆。生成语音的语言和参考语音的语言都不需要出现在大规模说话人多语言训练数据集中。

1719914582713

更多详细可以查看OpenVoice团队的论文和网站介绍。

论文:https://arxiv.org/abs/2312.01479

网站:https://research.myshell.ai/open-voice

安装OpenVoice

OpenVoice 通过3个在线渠道提供了服务,可以为不关注稳定性和质量、只是希望快速体验一下产品的用户提供服务。3个网站分别是:LeptonAIMyShellHuggingFace

1719914588170

当然如果你觉得自己技术能力足够,熟悉Linux, Python PyTorch,并且有服务器资源,那可以自己在Linux上进行安装部署。前置需要安装conda,大家自己在网上搜一下即可,不是很复杂。

·        

·        

conda create -n openvoice python=3.9
conda activate openvoice
git clone git@github.com:myshell-ai/OpenVoice.git
cd OpenVoice
pip install -e .

然后下载checkpoints,并解压到对应的文件夹。这个安装过程在Mac上也同样适用。

启动完成后,可以访问http://127.0.0.1:7860来使用。

使用OpenVoice

项目组说体验OpenVoice最方便的方法是直接使用MyShell中免费的TTS和即时语音克隆服务.

MyShell 是一个AI的集合,里面提供了很多的AI工具,比如文生图、语音、视频等。使用的时候需要自己创建一个机器人,然后来使用OpenVoice的能力,大家可以自己去体验一下。

另外也可以用HuggingFace的体验地址,这里的使用界面和自己本地部署是基本一致的。

Text Prompt

将需要转音频的文字写在这里

Style

可以根据需要选择语气。

Reference Audio

这里是参考音频,也就是我们希望克隆的声音

开始转换

写好文字,选好语气,就可以开始生成了。右侧会产生出新的音频。

在线的环境中主要是对英文的支持,中文支持不太好,OpenVoice实际是支持多语言的,在实际使用时只需安装对应的模型即可。

总结

总结

最后,想自己部署玩得顺畅,那最好有显卡,我的Mac 跑还是挺慢的。

OpenVoice 是一项技术,而不是一个产品。项目希望可以通过不断的努力,让免费的声音克隆也能像商业产品一样优秀。虽然如果使用正确的话它可以在大多数声音上工作,但请不要指望它在所有情况下都能完美工作,因为将一项技术转化为稳定的产品需要大量的工程工作。该技术的目标用户是开发人员和研究人员,而不是最终用户。虽然它不是完美的产品,但OpenVoice 是可用开源语音克隆技术中最先进的

1719914627233



项目信息

·        

项目名称:OpenVoice

·        

·        

GitHub 链接:https://github.com/myshell-ai/OpenVoice

·        

·        

Star 数:17K

·        

出自:https://mp.weixin.qq.com/s/2MEJVQMyB8u671ma7rS4Cw

本文档由网友提供,仅限参考学习,如有不妥或产生版权问题,请联系我们及时删除。 客服请加微信:skillupvip
评论
1 评论
丑八怪2024/7/24 9:53:20
哇塞,这OpenVoice简直是声控技术的“黑科技”啊!传统语音克隆要搞好久,这工具30秒就搞定了,还是开源的,经典!给开源社区的大佬们点赞。感觉像是穿越了历史,直接把科技带到了未来。文化上也是一大步,多语言支持,真是海纳百川。期待后续有更多应用,让声音更有“文化味”!
20秒读懂全文
伴读
**一句话总结文章摘要**:
OpenVoice是一款由openshell公司开源的声音克隆工具,通过30秒的音频样本即可准确克隆声音,支持多语言、音色精细控制,并提供在线和本地部署方式,目标用户为开发人员和研究人员。

**关键词**:
OpenVoice, 声音克隆, 音色克隆, 深度学习, 跨语言语音克隆, 开源工具, 在线服务, 本地部署, 音色控制,
One More Thing
One More Thing again ...

找组织,加入AI魔法学院群