nlp - 训练 Giza++ 模型并将其用于任意测试以获得单词对齐

问问题 2021-10-14T15:52:01.133

27 次

这是一个关于 Giza++ 的问题。

我正在尝试进行双文字对齐。我有一堆文件，它们是相互翻译的。我想获得这些文件之间的单词对齐。这就是我需要做的全部事情。我不需要将输出用于机器翻译。

我理解这应该如何工作的方式是，我用一个大数据集训练我的模型，然后我可以通过它运行我的文件以获取这些文件中的单词对齐。

我在从 Tatoeba 下载的大量句子数据集上下载、安装并运行 Giza++。如何将由此生成的文件用作经过训练的模型并通过它运行我的文件以获取单词对齐？

0 回答 0