我正在尝试使用 Moses 构建泰米尔语-英语翻译系统。https://github.com/joshua-decoder/indian-parallel-corpora/tree/master/ta-en是我的并行语料库数据源。dict 文件长约 70k 行,其他文件在 2-3k 范围内,训练文件长约 30k。如果有人暗示以下哪些是训练和调整的更好选择,会有所帮助?
目前,我使用训练文件进行训练,使用测试文件进行调优。有更好的组合吗?
我正在尝试使用 Moses 构建泰米尔语-英语翻译系统。https://github.com/joshua-decoder/indian-parallel-corpora/tree/master/ta-en是我的并行语料库数据源。dict 文件长约 70k 行,其他文件在 2-3k 范围内,训练文件长约 30k。如果有人暗示以下哪些是训练和调整的更好选择,会有所帮助?
目前,我使用训练文件进行训练,使用测试文件进行调优。有更好的组合吗?