作为一个更大项目的一部分,我想实现一个从语言A到语言B的机器翻译器。由于没有可用的工具可以自动对这组语言进行机器翻译,并且语言 B 的可用语料库非常少,我正在尝试执行以下操作:
1.给定一个语言A的句子,使用一个工具来获取它的语言A PoS(词性)标签集。
2.我用于 PoS 标记的工具(Freeling)没有返回解析树,所以我想从标签集构建我自己的解析树。
3.解析树完成后,逐级遍历(从根开始),按照语言B的语法规则对其元素重新排序。
在做了一些研究之后,我发现了 Earley 解析(它解析任何语言的能力引起了我的注意,因为语言B的语法可能会随着时间的推移而改变,所以我不能保证它总是符合任何特定标准)。 但是,鉴于我的最终目标是进行结构转移,我不确定使用自下而上的解析器并在将元素与规则匹配时尝试重新排序是否会给我带来更好的性能,或者我是否走错了路我的解决方案完全错误。