embedded - 小型嵌入式合成语音库/建议

Question

对于代码大小比语音质量更重要的 PIC 和/或 ARM 嵌入式系统，是否有任何易于使用的免费或廉价语音合成库？现在看来 1 兆的封装被认为是“紧凑的”，但很多微控制器都比这小。早在 1980 年代，Apple 聘请了一家承包商来生产 Macintalk，它以 26K 封装提供质量合理的语音，运行在 7.16MHz 68000 上，一个名为 SAM 的程序可以产生不太好的语音，但仍然可以使用，具有在 1MHz 6502 上运行的 16K 封装。SpeakJet 在某种类型的 PIC 上运行语音合成算法。

我可能不会特别需要产生语音，但希望能够说出由许多预设单词组成的信息。显然，可以简单地预先录制所有消息，但是对于例如 100 个单词的词汇表，我认为存储 16K 的代码加上可能 1K 的语音字符串会比存储 100 个单词的音频更紧凑。

或者，如果我想存储 100 个单词的音频，那么生成一组自然流动的单词的最佳方法是什么？在老式语音合成器上，任何给定的单词都可以用三种方式说出：中性屈折、下降屈折（好像后面跟着一个句号）或上升屈折（后面跟一个问号）。带有中性变形的单词可以按任何顺序拼接在一起，听起来不错。不过，我发现的 text-to-wave 工具似乎喜欢添加更精细的变形细节，如果单词被分割并重新排序，这听起来“关闭”。是否有任何工具设计用于产生可以很好地连接和拼接的波？如果我确实使用了这样的工具，那么哪种音频格式最适合存储波形，以便在小型微控制器上进行高效解码？

score 0 · Accepted Answer

上次我这样做时，我能够添加硬件，例如：http://www.sparkfun.com/products/9578。您的环境中可能存在专利责任，就像我遇到的那样，迫使商业软件堆栈或 OTS 芯片。

否则，我将http://www.speech.cs.cmu.edu/flite/用于更宽松的项目，并且效果很好。

embedded - 小型嵌入式合成语音库/建议

1 回答 1

Related

Reference