你们中的大多数人可能知道谷歌翻译的文本到语音合成器,因为你可以在这里以编程方式访问:
http://translate.google.com/translate_tts?tl=en&q=text
我的印象是它有时会使用 espeak,但在主要语言中,质量比这要好得多。有人知道谷歌在用什么,或者他们在用什么声音吗?显然这不是正常的,也不是 mbrola espeak 的声音。
你们中的大多数人可能知道谷歌翻译的文本到语音合成器,因为你可以在这里以编程方式访问:
http://translate.google.com/translate_tts?tl=en&q=text
我的印象是它有时会使用 espeak,但在主要语言中,质量比这要好得多。有人知道谷歌在用什么,或者他们在用什么声音吗?显然这不是正常的,也不是 mbrola espeak 的声音。
我会查看谷歌收购列表
(维基百科,谷歌收购列表):
84 2010 年 12 月 3 日 语音艺术 语音合成 英国谷歌语音,谷歌翻译 [90]
我用红宝石做了一个简单的包装。https://github.com/c2h2/tts
gem install tts
require 'tts'
'hello world!".to_file "en"
试试pyttsx
:https ://github.com/parente/pyttsx
$ pip install pyttsx
$ python
>>> import pyttsx
>>> e = pyttsx.init()
>>> e.say('haha hahaha haha haha hahaha')
>>> e.runAndWait()
如果谷歌翻译使用的是espeak,我会感到惊讶。首先,结果太好了,没有很多典型的espeak缺陷。其次,众所周知,谷歌在他们的演讲组中使用了像深度网络这样的想法(参见 Geof Hinton 的工作以及http://research.google.com/pubs/SpeechProcessing.html)。
使用 python3 的pyttsx3模块。
仅pip install pyttsx3
用于安装