我正在尝试为印度口音英语(不是任何印度语言)创建一个 TTS 引擎。
我已经有一个印度口音英语的录音数据库。那么接下来的步骤是什么?
我认为我们需要用“.lab”扩展文件标记它们(好吧,我真的不知道!)。带有“.utts”扩展名的文件是什么?
在使用 HMM 实现 TTS 引擎时,说话人自适应训练和说话人依赖训练的目的是什么?
我用谷歌搜索了很多,但找不到详细的解释。(我只能找到一些与之相关的论文和期刊)
如果您可以向我们提供资源链接,指导我使用 Hidden Marvkov 模型创建自定义 TTS,那将非常有帮助。
谢谢你。