我想为美国本土语言 (wayuunaiki) 创建一个 TTS 系统。该语言是用拉丁(西方)字母书写的。我也有关于语音的信息(将每个单词转换为 IPA 符号的规则)。
我打算创建一个本地人录音的数据库。然后我想以某种方式训练该数据,使用 IPA 等效信息生成更准确的语音模型。
我对自然语言处理完全陌生,所以我的问题是……我可以使用哪些工具来执行我的计划?
我听说 HTK 和 CMU Sphinx 在语音识别方面相当出色。不知道语音生成。也听说过 Festival,但我读到它只使用预定义的最知名的语言:英语、西班牙语等。
请原谅我的打字错误。我还在学习英语。提前致谢!