4

对于代码大小比语音质量更重要的 PIC 和/或 ARM 嵌入式系统,是否有任何易于使用的免费或廉价语音合成库?现在看来 1 兆的封装被认为是“紧凑的”,但很多微控制器都比这小。早在 1980 年代,Apple 聘请了一家承包商来生产 Macintalk,它以 26K 封装提供质量合理的语音,运行在 7.16MHz 68000 上,一个名为 SAM 的程序可以产生不太好的语音,但仍然可以使用,具有在 1MHz 6502 上运行的 16K 封装。SpeakJet 在某种类型的 PIC 上运行语音合成算法。

我可能不会特别需要产生语音,但希望能够说出由许多预设单词组成的信息。显然,可以简单地预先录制所有消息,但是对于例如 100 个单词的词汇表,我认为存储 16K 的代码加上可能 1K 的语音字符串会比存储 100 个单词的音频更紧凑。

或者,如果我想存储 100 个单词的音频,那么生成一组自然流动的单词的最佳方法是什么?在老式语音合成器上,任何给定的单词都可以用三种方式说出:中性屈折、下降屈折(好像后面跟着一个句号)或上升屈折(后面跟一个问号)。带有中性变形的单词可以按任何顺序拼接在一起,听起来不错。不过,我发现的 text-to-wave 工具似乎喜欢添加更精细的变形细节,如果单词被分割并重新排序,这听起来“关闭”。是否有任何工具设计用于产生可以很好地连接和拼接的波?如果我确实使用了这样的工具,那么哪种音频格式最适合存储波形,以便在小型微控制器上进行高效解码?

4

1 回答 1

0

上次我这样做时,我能够添加硬件,例如:http://www.sparkfun.com/products/9578。您的环境中可能存在专利责任,就像我遇到的那样,迫使商业软件堆栈或 OTS 芯片。

否则,我将http://www.speech.cs.cmu.edu/flite/用于更宽松的项目,并且效果很好。

于 2012-02-11T19:24:38.307 回答