2

I've been scouring the SO board and google and can't find any really good recommendations for this. I'm building a Twilio application and the text-to-speech (TTS) engine is way bad. Plus, it's a pain in the ass to test since I have to deploy every time. Is there a significantly better resource out there that could render to a WAV or MP3 file so I can save and use that instead? Maybe there's a great API for this somewhere. I just want to avoid recording 200 MP3 files myself, would rather have this generated programatically...

Things I've seen and rejected:

Thinking of paying for this, but not sure yet: https://ondemand.neospeech.com/

Obviously I'm new to this, if I'm missing something obvious, please point it out...

4

2 回答 2

2

我不确定您是否可以访问 Mac 计算机。Mac 在操作系统中内置了相当先进的 tts。苹果花了很多钱聘请顶级工程师来研究它。它可以从命令提示符轻松控制甚至自动化。它还有很多内置的声音可供选择。这就是我在最近安装的电话系统上使用的。但我意识到,如果您没有 Mac,这不是一个选择。

您可能想要查看的另一个是http://cepstral.com/他们有非常逼真的声音。我认为它们曾经是开源的,但它们不再是开源的,现在您需要支付许可费。它们非常常用于高端商业应用。并且不太适合希望将文章阅读给他们的家庭用户。

于 2011-04-28T14:28:37.980 回答
0

我喜欢YAKiToMe!网站最好。它是免费的,而且声音质量上乘。如果您仍然担心给他们您的电子邮件,他们在多年的使用中从未向我发送垃圾邮件,并且在与他们签约后我从未进入任何垃圾邮件列表,所以我怀疑他们出售了我的电子邮件。无论如何,这项服务很棒,并且有很多功能可以将电子文本转换成不同语言的音频文件。

至于您正在寻找的 API,YAKiToMe!有一个有据可查的 API 并且可以免费使用。您必须在网站上注册才能使用它,但那是因为它可以让您自定义发音和语音选择,因此需要将您与其他用户区分开来。

于 2013-09-18T18:59:14.023 回答