Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
如何为我们的特定领域语言模型创建字典(.dict)文件。我正在使用 CMU 工具包创建 ARPA 格式的语言模型,但是没有创建 .dict 文件的选项。提前致谢。
有一个简短的教程页面,解释了为 Sphinx 生成字典的几种方法。
一般来说,对于英语来说,现有的字典涵盖了相当多的单词。如果它不包含您的任何特定领域单词,则发音应由第一个链接中列出的字素到音素 (G2P) 系统生成。G2P 从现有字典中学习并为新字典生成发音。
需要考虑的一件事是声学模型。如果您使用一些已经训练过的 Sphinx 模型,则应确保使用与训练字典相同的音素集生成发音。