1

目前我是摩西的新手,并且已经训练了一些网站上提供的样本数据集。我正在寻找更多数据集来训练系统。这些可以在线获得吗?在谷歌上搜索时我应该看什么?

4

1 回答 1

4

您可以在以下位置找到几个语料库: http: //opus.lingfil.uu.se

此外,一些开源应用程序包含他们的双语 PO 文件,但您必须检查许可证。

我的建议是建立一个垂直的(即特定领域的)MT 系统,而不是一个通用的系统,以获得更好的结果。所以这个决定会影响你选择的语料库。

我希望这有帮助!

于 2015-04-24T02:21:27.960 回答