nlp - 为自定义语言设计 TTS（文本到语音）系统的工具包？

Question

我想为美国本土语言 (wayuunaiki) 创建一个 TTS 系统。该语言是用拉丁（西方）字母书写的。我也有关于语音的信息（将每个单词转换为 IPA 符号的规则）。

我打算创建一个本地人录音的数据库。然后我想以某种方式训练该数据，使用 IPA 等效信息生成更准确的语音模型。

我对自然语言处理完全陌生，所以我的问题是……我可以使用哪些工具来执行我的计划？

我听说 HTK 和 CMU Sphinx 在语音识别方面相当出色。不知道语音生成。也听说过 Festival，但我读到它只使用预定义的最知名的语言：英语、西班牙语等。

请原谅我的打字错误。我还在学习英语。提前致谢！

score 4 · Accepted Answer

您可以在 Festival 中添加新语言，它实际上是专门为简化新语言创建而设计的。有关更多详细信息，请阅读 festvox 书：

另一个需要考虑的工具包是 OpenMary，也可以查看他们的文档

它更现代，对您来说可能更容易。

在任何情况下，您都必须花一些时间编写代码来描述您的语言。通常它是大约 300 行代码。之后，您可以记录单说话人 TTS 数据库并运行语音构建过程。你记录的越多，结果就会越好。

score 0 · Accepted Answer

0

使用 Festival 工具包进行文本转语音（提示：使用 Linux 操作系统）

于 2016-07-21T10:31:25.930 回答

2 回答 2