我有一些评论,我想将它们分类为正面或负面。到目前为止,我有一个带注释的数据集。
问题是前 100 行被归类为正数,其余 100 行被归类为负数。
我正在使用 SQL Server Analysis-2008 R2。Class 属性有 2 个值,POS 表示正数,NEG 表示负数。
我也使用最大输入/输出属性= 0(想使用所有属性)的朴素贝叶斯算法进行分类,测试集最大案例设置为30%。提升图表的当前分数是 0.60。
我是否必须将它们混合在一起,例如 2 个 POS 后跟 1 个 NEG,以获得更好的分类精度?