3

回到过去,文本转语音虽然是最先进的,但非常不完善。当您输入一个单词时,它几乎会以您的拼写方式阅读它……单调。很多时候,结果会很有趣。如今,文本转语音技术太聪明了,不能以可以带来笑声的方式搞砸。

作为一个个人项目,我想制作一个可以带回这种旧式文本到语音的应用程序,即使只是作为一个玩具。在 .Net 中,我可以使用COM 对象System.Speech.dllSpeechLib COM 对象。(微软语音对象库)两者似乎都使用了操作系统内置的文本到语音,这又太聪明了。有什么方法可以配置这些来禁用任何使它变得智能的东西?

我尝试了一些不同的“SayAs”选项,我尝试将文化设置为不变(例外!),现在我正在研究 SSML。开始看起来我必须找到旧技术本身,但我什至不知道从哪里开始。

作为我希望看到的混乱的一个例子,这里有一些 Moonbase Alpha 给你:http ://www.youtube.com/watch?v=Hv6RbEOlqRo (确保你戴着耳机!)

将这些新奇的文本到音素转换器、规范化器、无线电话和...

4

2 回答 2

4

您可能想要所谓的“NRL 算法”,它在 1970 年代和 1980 年代被Votrax语音合成器使用。我记得我的一个朋友有一个我们(通过串行端口)连接到我的 Osborne I。我们从它“说”的方式中得到了很多笑声。例如,“计算机”出现了“计算机”。

或者也许是我朋友的Microvox。这似乎敲响了警钟。当时,所有的文本到语音框都使用几乎相同的技术。链接的文章是信息的源泉。大约一半是关于文本到语音转换的较长部分。它描述了规则和基本算法。我怀疑,通过一些研究和实验,您可以复制 Microvox 的语音合成。

NRL 算法是由Unix speak 命令实现的,其来源显然已被历史的伟大比特桶所迷失。然而,MD McIlroy写了一篇关于它的论文。 按规则合成英语语音(这是一个包含扫描页面的 tar 文件)。

如果我有时间,这将是一个有趣的项目。祝你好运。让我知道您是否可以使用它。

于 2010-09-21T04:52:30.977 回答
2

好吧,我只是偶然发现了旧的“Microsoft Voice Text”库:vtext.dll

这似乎是我一直在寻找的!与现代 TTS 库相比,界面非常简单。结果似乎与我链接的视频中的声音不完全相同,但这可能是不同的实现。不管怎样,是时候回忆一下了。

var tts = new HTTSLib.TextToSpeech();
tts.Speak("ebrbrbrbrbrbrbrbr");

出于某种原因,当我让它说“这里”时,它会崩溃 vshost.exe。但由于这只是一个愚蠢的个人项目,我可以忽略它。

于 2010-10-10T03:51:08.150 回答