9

我对机器翻译的 BLUE Score 计算有一些疑问。我意识到他们可能对 BLEU 有不同的指标。我发现代码报告了 BLEU 的五个值,即 BLEU-1、BLEU-2、BLEU-3、BLEU-4 和最后的 BLEU,这似乎是前四个 BLEU 的指数平均值。我仍然不清楚它们之间的区别是什么。你有什么想法?谢谢

Ps 一开始我以为这个问题更多是理论性的内容,贴在meta stackexange上。版主已关闭并将其评论为 stackoverflow 类型的问题。所以请不要再惩罚我了。=)

4

2 回答 2

11

资料来源: http: //www.statmt.org/book/slides/08-evaluation.pdf

我没有听说过 BLEU-1 和 BLEU-2,但我猜它在 BLEU 分数的公式中意味着 1-gram、2-gram、3-gram 和 4-gram,我的意思是precision[i] = BLEU-i在你问题的公式中:
在此处输入图像描述

于 2017-06-10T14:06:54.703 回答
4

实际上,BLEU-n 不仅仅使用 n-gram 分数。它计算 1-gram 到 n-gram 分数,并赋予它们相同的权重以计算最终分数。有关更多信息,请参阅此链接中的“累积 N-Gram 分数”部分。

于 2018-04-14T20:59:03.700 回答