我正在尝试实现一个图像字幕模型(CNN + LSTM)并作为验证指标,我使用的是 BLEU 分数。更准确地说,是 nltk 的 corpus_bleu 实现。
我尝试使用不同的 SmoothingFunctions 并且我得到了相同候选和参考的不同值。
SmoothingFunction().method1 -> 0025682587115391834
SmoothingFunction().method2 -> 0.01435390900932359
SmoothingFunction().method3 -> 0.005106152442970232
我应该使用“默认”方法还是取决于任务本身?
提前致谢