回到过去,文本转语音虽然是最先进的,但非常不完善。当您输入一个单词时,它几乎会以您的拼写方式阅读它……单调。很多时候,结果会很有趣。如今,文本转语音技术太聪明了,不能以可以带来笑声的方式搞砸。
作为一个个人项目,我想制作一个可以带回这种旧式文本到语音的应用程序,即使只是作为一个玩具。在 .Net 中,我可以使用COM 对象System.Speech.dll
和SpeechLib
COM 对象。(微软语音对象库)两者似乎都使用了操作系统内置的文本到语音,这又太聪明了。有什么方法可以配置这些来禁用任何使它变得智能的东西?
我尝试了一些不同的“SayAs”选项,我尝试将文化设置为不变(例外!),现在我正在研究 SSML。开始看起来我必须找到旧技术本身,但我什至不知道从哪里开始。
作为我希望看到的混乱的一个例子,这里有一些 Moonbase Alpha 给你:http ://www.youtube.com/watch?v=Hv6RbEOlqRo (确保你戴着耳机!)
将这些新奇的文本到音素转换器、规范化器、无线电话和...