8

There is an implementation of BLEU score in Python NLTK, nltk.translate.bleu_score.corpus_bleu

But I am not sure if it is the same as the mtevalv13a.pl script.

What is the difference between them?

4

1 回答 1

8

TL;博士

在评估机器翻译系统时使用https://github.com/mjpost/sacrebleu 。

简而言之

不,NLTK 中的 BLEU 与mteval-13a.perl.

但它可以非常接近,请参阅https://github.com/nltk/nltk/issues/1330#issuecomment-256237324

nltk.translate.corpus_bleu对应于mteval-13a.plngram 的 4 阶,具有一些浮点差异

可以从https://github.com/nltk/nltk_data/blob/gh-pages/packages/models/wmt15_eval.zip下载比较的详细信息和使用的数据集或:

import nltk
nltk.download('wmt15_eval')

主要区别:

在此处输入图像描述


在长

mteval-13a.pl和之间有几个区别nltk.translate.corpus_bleu

除了差异之外,NLTK BLEU 分数还包含更多功能:

最后,为了验证 NLTK 版本的 BLEU 中添加的功能,为它们添加了回归测试,请参阅https://github.com/nltk/nltk/blob/develop/nltk/test/unit/translate/test_bleu.py

于 2017-09-07T06:34:46.070 回答