我正在使用 Weka gui 在数据集上训练 SVM 分类器(使用 libSVM)。.arff 文件中的数据是
@relation Expandtext
@attribute message string
@attribute Class {positive, negative, objective}
@data
我用字符串到词向量把它变成一个词袋,运行 SVM 并获得不错的分类率。现在我有我的测试数据,我想预测他们不知道的标签。同样,它的标题信息是相同的,但是对于每个类,它都标有问号(?),即
'Musical awareness: Great Big Beautiful Tomorrow has an ending\u002c Now is the time does not', ?
我再次对其进行了预处理,字符串到单词向量,类与训练数据的位置相同。
我进入“分类”菜单,加载我训练过的 SVM 模型,选择“提供的测试数据”,加载测试数据并右键单击模型说“在当前测试集上重新评估模型”,但它给了我测试和训练不兼容的错误。我不确定为什么。
我是否以错误的方式标记测试数据?我究竟做错了什么?