1

我有一组手动标记的约 120K 推文。如果我使用 VADER 的复合分数,它只匹配约 24% 的记录的手动标记,textblob 匹配约 35% 的手动标记记录。如果我将 Vaders 复合分数和 textblob 分数相加,然后除以 2,得到的情绪结果与手动标记匹配的概率约为 70%。有什么理由让它更准确还是只是巧合?

4

1 回答 1

0

我认为您偶然发现了集成学习背后的想法。通常情况下,将多个模型放在一起并结合它们的预测会产生更好的结果。您的实现可以被认为是一个同等权重的软投票合奏。有关更多示例和其他实现,scikit-learn 投票分类器文档很棒。

于 2021-10-03T00:03:40.833 回答