我正在做一个机器学习项目,我正处于进展的第一阶段。我正在提取功能并测试要使用或不使用的功能。我有一个由 2 个类组成的数据集。我想检查情绪和作为其中任何一个群体之间是否存在关系。我的数据如下所示:
group_a this is a tweet
group_b this is another tweet
group_b this is another tweet
group_a this is another tweet
如何找到情绪和群体之间的相关性?因为这是我项目的功能选择部分,所以我可以使用任何工具而不是手动实现它。WEKA、PRTools 或任何其他工具,如果您能告诉我如何操作,欢迎您。
PS:实际上在实现算法之前,我想检查是否可以得到类似的东西:
即 group_a 比 group_b 更负面
所以在我的测试数据中,当我得到一个句子时,我可以说如果它是一个负面情绪句子,它可能与 group_a 有关