我的cld2语言检测模型 (langID) 返回输入句子以对以下值进行分类
{ reliable: true,
textBytes: 181,
languages:
[ { name: 'ITALIAN', code: 'it', percent: 61, score: 774 },
{ name: 'ENGLISH', code: 'en', percent: 38, score: 1573 } ],
chunks:
[ { name: 'ITALIAN', code: 'it', offset: 0, bytes: 116 },
{ name: 'ENGLISH', code: 'en', offset: 116, bytes: 71 } ] }
其中textBytes
表示输入文本的大小,表示句子中percent
的分布,而表示检测质量的指标(越小越好)。也就是说,在全新的CLD3神经网络中,分类的结果就是准确率(所以是一个介于 0 和 1 之间的概率值),就像code
score
println(ld.getCode(0))
println(ld.getScore(0))
en
0.99
我想弄清楚如何将 CLD2 分数转换为概率值,以便将结果与新的 CLD3 模型进行比较。