我正在写关于用德语文本识别命名实体的硕士论文,我想将 Weka 用于机器学习部分。我是 Weka 的新手,所以我不明白为什么我没有得到结果,尽管训练过程很成功并且我得到了一个模型。
我用 J48 训练了一个模型,另一个用 NaiveBayes 训练。首先,我收到了已经在 stackoverflow 上讨论过的错误消息(训练集和测试集不兼容),但我更正了这一点。因此,当我重新评估时,我没有收到任何错误消息,并且 Weka 给出了结果,但这些结果除了零之外不包含任何其他内容:
=== 重新评估测试集 ===
用户提供的测试集关系:train-weka.filters.unsupervised.attribute.StringToNominal-R1-10,12-last 实例:未知(尚未)。渐进式阅读属性:15
=== 总结 ===
实例总数 0
忽略类未知实例 207484
=== 按等级划分的详细准确度 ===
TP Rate FP Rate Precision Recall F-Measure ROC Area Class
0 0 0 0 0 ? O
0 0 0 0 0 ? I-PER
0 0 0 0 0 ? I-LOC
0 0 0 0 0 ? I-MISC
0 0 0 0 0 ? I-ORG
0 0 0 0 0 ? B-MISC
0 0 0 0 0 ? B-LOC
0 0 0 0 0 ? B-ORG
加权平均 南 南 南 南 南 南 南
=== 混淆矩阵 ===
abcdefgh <-- 分类为
0 0 0 0 0 0 0 0 | 一个 = O
0 0 0 0 0 0 0 0 | b = I-PER
0 0 0 0 0 0 0 0 | c = I-LOC
0 0 0 0 0 0 0 0 | d = I-MISC
0 0 0 0 0 0 0 0 | e = I-ORG
0 0 0 0 0 0 0 0 | f = B-MISC
0 0 0 0 0 0 0 0 | g = B-LOC
0 0 0 0 0 0 0 0 | h = B-ORG
我的测试和训练数据只包含名义数据和数字数据,arff 文件的标题是相同的,我没有从 Weka 收到任何错误消息。因此,我不知道我在哪里做错了什么以及我必须做什么才能得到结果。我尝试使用 Weka 版本 3-6 和版本 3-7-10,但结果始终相同。
有谁知道为什么我的测试集的评估不起作用?提前致谢!