1

我想用 3 个类别(正面、中性和负面)进行情绪分析。我已经看到了很多关于两个类别(正面和负面)情绪分析的工作,但对于 3 个类别来说则更少。如果我想在 Scikit-learn 中使用词袋方法和分类器,例如逻辑回归或 SVM,这将如何工作?我的输出预测 3 个类的步骤是什么?

我是否必须将每个类视为二进制分类并做一些事情来组合结果,还是 sklearn 能够为我做一些处理,所以我不必指定这个?

4

1 回答 1

2

有三种可能的方法:

  1. 使用多类算法,例如逻辑回归或决策树(它们本质上是多类的)或用于 SVM 等二进制算法的一对一或一对一的包装器。
  2. 如果您想利用中性文本“介于”正负文本之间的事实,您可以使用有序分类模型,例如mord包中的有序逻辑回归。
  3. 如果您想利用类的顺序,但想留在 scikit-learn 中,我建议您首先将任何回归模型拟合到您的数据(例如梯度提升回归器),然后在其预测之上使用逻辑回归。
于 2017-11-19T13:47:58.553 回答