我正在阅读最重要的示例:关于标记化的http://www.openfst.org/twiki/bin/view/FST/FstExamples 。
在示例中,他们创建了三个 fst:Mars.fst
、Martian.fst
和man.fst
,并手动运行一些 fst 命令以将它们合并为一个大传感器。他们从 中得到“Mars”、“Martian”和“man”三个wotw.syms
词,共有 7102 个词。
我的问题是,有没有一种聪明的方法可以为所有 7102 个单词创建一个word.fst
,以便所有 7102 个单词都可以制成一个大自动机,还是必须手动完成,就像他们为三个单词 Martian、Mars 所做的那样,和男人?