我正在尝试实现英语单词到音素单词的翻译,以创建 CMUSphinx 的语言模型。现在我正在使用以下工具来实现单词翻译链接
例如,如果我给一个文本文件作为输入,其中包含以下单词,它将被翻译如下
NAMASTE N AH M EY S T
但我想使用 Java 动态地执行此操作。是否有任何 API 或库可以实现这一点。我不想重新发明轮子。或者其他一些具有我可以使用的库的编程语言。
CMUSphinx 可以自己做。您可以下载g2p 模型并配置字典使用。
仅用于转换,您可以使用 G2PConverter 类:
G2PConverter converter = new G2PConverter("model.fst.ser")
converter.init()
ArrayList<Path> = converter.phoneticize(word,1);
或者,您可以强制字典创建缺失的发音。