TTS，一个奇妙的AI工具

0. 简介

TTS是一个将文本变换成语音的AI工具。在自媒体盛行的今天，很多人尝试制作视频发到自媒体平台上，通过获得流量的方式实现直接或间接变现。有部分人天生能说会道，全靠一张嘴，能完成整个视频。但大多数人，很难一次性的流畅表达一个主题，往往需要在制作视频时加入配音。
当我们制作视频的时候，就会发现，给视频配音真是一件非常专业的事，对于非专业人士，费工费力后，完成的配音效果往往并不理想。
TTS就解决了这个问题，可以直接将写好的文案或台本转为语音播报。网络上有很多文字转语音网站都采用了这个TTS开源工具。这个AI工具支持13种语言，包括汉语。English, Spanish, French, German, Italian, Portuguese, Polish, Turkish, Russian, Dutch, Czech, Arabic, and Chinese (Simplified).

1. 安装TTS的安装非常简单，还是pip安装法，在命令行终端中输入以下内容：

pip install TTS

不过，这次安装并不是非常顺利，遇到了问题，原因是我的Win10中没有VC++。可以按提示去安装VC++，注意要安装C++开发运行环境。

安装完成后，再次运行pip install TTS

这个AI工具的依赖库非常多，且都指定了版本。如果你电脑中有类似的AI项目在运行，强烈建议以虚拟环境的方式进行安装。可参考文章《virtualenv，一个神奇的python工具》

2. 模型和TTS运行TTS安装完成后需要下载模型才可以工作，下面链接给出的是中文模型的地址。中文转语音模型下载完成后安装在C:\Users\**\AppData\Local\tts目录下。这时就可以运行这个TTS了。TTS给出了两种运行方式，命令行和Python接口。命令行运行如下：

1 tts --text "你好" --model_name "tts_models/zh-CN/baker/tacotron2-DDC-GST" --out_path 1.wav

python代码运行如下：

1 from TTS.api import TTS

2tts=TTS("tts_models/zh-CN/baker/tacotron2-DDC-GST")

3 tts.tts_to_file(text="你好", file_path="1.wav")

3. 模型性能和训练TTS项目中给出了TTS三个模型和主流模型的评价对比图，从图中可以看到，TTS模型整体表现中等偏下。主要原因是TTS提供的是一个开源框架，公开的模型性能与商业化模型之间存在差距。如果想到得到更好的模型，可以自己进行进一步模型训练。

出自：https://mp.weixin.qq.com/s/QEYGHfeWCj3oCMTpyprMgg