我有一个未标记的数据集,我想用我新训练的分类器在 Weka 中使用 NaiveBayes 分类对其进行分类。所以实际上,当在 weka 的分类模式下,如果我给出选项 Supplied Test set,那么只有当它被标记并评估并给出准确性时,它才会接受测试集。但我想要的是使用 train.csv 或 train.arff 文件对其进行训练,然后给它一个新的看不见且未标记的 test.csv 或 test.arff 文件,并对它进行分类并根据训练文件中的类给它标签。但是,如果我向 wweka 提供一个未标记的文件作为测试文件,它会给出:
错误:训练和测试集不兼容
我的训练和测试文件的示例格式如下:
火车.csv 文件: 文章故事.......曲棍球课 1 0 ...... 0 政治 0 0 .......1 运动 . . . . . 运动的
和 Test.csv 文件:
文章故事.......曲棍球课 0 1 ...... 0 1 0 ........1 . . . . .
那么如何使用 NaiveBayes 分类器对 Weka 中未标记的数据集进行分类?