当前位置: 首页 > 生活 > 正文

语音库 类似于espeak

作者:admin 发布时间:2023-11-12 16:47:26 分类:生活 浏览:87


上次写了一篇《Python只需9行代码,十几万字的文稿轻松转换为MP3》的文章,但这里我用的似乎最近简单的pyttsx3,执行效率快,但也有缺点,那就是音色太少,只有单纯的机械音,这里我们就好好介绍下,在python上可用的各类文字转语音库。

python常见文字转语音库:

国外库:

gTTS (Google Text-to-Speech): 这是由Google提供的一个简单易用的库,可通过网络API将文本转换为语音。

使用gTTS库需要联网。

安装方式:pip install gTTS

pyttsx3: 这是一个跨平台的文本到语音库,支持多个TTS引擎。

它可以在Windows,Linux和Mac上使用,并且不需要联网。

安装方式:pip install pyttsx3

pyttsx: 这也是一个文本到语音库,与pyttsx3类似,但使用较旧的API,并且支持的平台较少。

安装方式:pip install pyttsx

espeak: 这是一个开源的文本到语音引擎,可以在多个平台上使用,包括Linux和Windows。

你可以通过Python的subprocess模块调用espeak命令行程序来实现文字转语音。

安装方式:sudo apt-get install espeak

Festival: 这是另一个开源的文本到语音系统,可用于多个平台。

,你可以使用subprocess模块在Python中调用Festival命令行程序。

Amazon Polly (boto3): Amazon Polly是亚马逊提供的语音合成服务。

你可以使用Python的AWS SDK(boto3)来调用Amazon Polly API并将文本转换为语音。

安装方式:pip install boto3

Microsoft Text-to-Speech (pyttsx3 with Azure TTS): 微软提供了自己的文本到语音服务,称为Azure Text-to-Speech。

你可以使用pyttsx3库与Azure TTS集成,将文本发送到Azure TTS API,并获取合成的语音。

安装方式:

IBM Watson Text-to-Speech: IBM Watson提供了文本到语音服务。

你可以使用Python SDK来连接到IBM Watson TTS API,并进行文字转语音。

安装方式:

国内库:

百度语音合成:百度提供了语音合成服务,称为百度语音合成(Baidu Text-to-Speech)。

你可以通过调用百度的语音合成API将文本转换为语音。

需要注意的是,使用此服务可能需要注册百度开发者账号并获取API密钥。

安装方式:pip install baidu-aip

讯飞语音合成:讯飞是中国领先的人工智能公司,也提供了语音合成服务。

讯飞语音合成可以将文本转换为自然流畅的语音,适用于多种应用场景。

科大讯飞TTS:除了讯飞语音合成,中国科大讯飞也提供了TTS(Text-to-Speech)服务。

他们的TTS系统通常也被广泛应用于各种语音合成场景。

阿里云语音合成:阿里云提供的文本转语音服务,通过阿里云SDK连接到API实现语音合成。

关于安装:

一般直接运行pip install xxx即可。

但是也有例外比如espeak:espeak通常是作为系统软件而不是Python库安装的。

你可以根据你使用的操作系统自行安装espeak。

还有安装Festival,Festival通常也是作为系统软件而不是Python库安装的。

你可以在Festival的官方网站上找到相应的安装指南。

其他几个没写安装方式的因为都是需要通过API调用来使用它们的文本到语音功能,如Microsoft Text-to-Speech (Azure TTS)、IBM Watson Text-to-Speech、。

讯飞语音合成还有阿里云语音合成

而我们大部分使用的文字转语音工具采用的基本都是这类接口方式开发的,比如我征用的这个:

填入对应的秘钥即可使用,一般这类自己申请填入也可以,每天会有一定免费时长或次数。

优势就在于可以调音色。

适合做短视频的人使用,比如做影视解说之类的,文案粘贴进去,选择喜欢的声音,再用剪映简单制作下即可发布。

但也有不足之处,这类软件基本会限制文本字数,所以,如果文稿较长,需要分段执行,并且生成时间比较长。

虽然收集了这么多,但我真正使用过的也就3种,去掉一部分国内不能使用的,再去掉一部分需要API秘钥的,最后我也就使用pyttsx3多一些。

另外在写这篇文稿之前,我一直以为pyttsx3无法调节角色,但通过资料发现,它也可以针对不同的场景进行音色转换,具体我还要再研究一下。

下篇等我测试结果吧!


标签:语音


最新推荐

关灯