我正在开发一个 Java 程序(分类器),它读取给定的文本文件并输出相关的情绪(正面或负面或中性)。
该程序计算三个类别(正面或负面或中性)的三个概率。鉴于这三个概率,我想给文章打分(最高 10 分)。
示例- 如果假设,
P(Positive) = 0.0006
P(Negative) = 0.0001
P(Neutral) = 0.0002
那么很明显,这篇文章是高度正面的,因此评级应该是高的,即 8 或以上。
PS - 概率加起来不等于 1,而且是非常小的数字(在 ~ 10^-(100) 的范围内)
有人可以指出任何可以帮助我评价文章的算法吗?
谢谢
编辑 我不能简单地采用比率。例如
P(Positive) = 1.2*E(-117)
P(Negative) = 4.7*E(-112)
P(Neutral) = 9.3*E(-110)
上面显示的概率差异很大。因此,采用比率将毫无意义。