目前我是摩西的新手,并且已经训练了一些网站上提供的样本数据集。我正在寻找更多数据集来训练系统。这些可以在线获得吗?在谷歌上搜索时我应该看什么?
问问题
332 次
1 回答
4
您可以在以下位置找到几个语料库: http: //opus.lingfil.uu.se
此外,一些开源应用程序包含他们的双语 PO 文件,但您必须检查许可证。
我的建议是建立一个垂直的(即特定领域的)MT 系统,而不是一个通用的系统,以获得更好的结果。所以这个决定会影响你选择的语料库。
我希望这有帮助!
于 2015-04-24T02:21:27.960 回答