我正在使用朴素贝叶斯分类器对客户支持进行情绪分析。但不幸的是,我在客户支持领域没有大量带注释的数据集。但是我在同一个域中有少量注释数据(大约 100 个正数和 100 个负数)。我也有亚马逊产品评论数据集。
无论如何,我是否可以使用 mahout 实现加权的朴素贝叶斯分类器,这样我就可以对一小部分客户支持数据给予更大的权重,对亚马逊产品评论数据给予更小的权重。我猜对上述加权数据集的训练将大大提高准确性。请帮助我。
我正在使用朴素贝叶斯分类器对客户支持进行情绪分析。但不幸的是,我在客户支持领域没有大量带注释的数据集。但是我在同一个域中有少量注释数据(大约 100 个正数和 100 个负数)。我也有亚马逊产品评论数据集。
无论如何,我是否可以使用 mahout 实现加权的朴素贝叶斯分类器,这样我就可以对一小部分客户支持数据给予更大的权重,对亚马逊产品评论数据给予更小的权重。我猜对上述加权数据集的训练将大大提高准确性。请帮助我。