2

我正在写关于用德语文本识别命名实体的硕士论文,我想将 Weka 用于机器学习部分。我是 Weka 的新手,所以我不明白为什么我没有得到结果,尽管训练过程很成功并且我得到了一个模型。

我用 J48 训练了一个模型,另一个用 NaiveBayes 训练。首先,我收到了已经在 stackoverflow 上讨论过的错误消息(训练集和测试集不兼容),但我更正了这一点。因此,当我重新评估时,我没有收到任何错误消息,并且 Weka 给出了结果,但这些结果除了零之外不包含任何其他内容:

=== 重新评估测试集 ===

用户提供的测试集关系:train-weka.filters.unsupervised.attribute.StringToNominal-R1-10,12-last 实例:未知(尚未)。渐进式阅读属性:15

=== 总结 ===

实例总数 0
忽略类未知实例 207484

=== 按等级划分的详细准确度 ===

           TP Rate   FP Rate   Precision   Recall  F-Measure   ROC Area  Class
             0         0          0         0         0          ?        O
             0         0          0         0         0          ?        I-PER
             0         0          0         0         0          ?        I-LOC
             0         0          0         0         0          ?        I-MISC
             0         0          0         0         0          ?        I-ORG
             0         0          0         0         0          ?        B-MISC
             0         0          0         0         0          ?        B-LOC
             0         0          0         0         0          ?        B-ORG

加权平均 南 南 南 南 南 南 南

=== 混淆矩阵 ===

abcdefgh <-- 分类为

0 0 0 0 0 0 0 0 | 一个 = O

0 0 0 0 0 0 0 0 | b = I-PER

0 0 0 0 0 0 0 0 | c = I-LOC

0 0 0 0 0 0 0 0 | d = I-MISC

0 0 0 0 0 0 0 0 | e = I-ORG

0 0 0 0 0 0 0 0 | f = B-MISC

0 0 0 0 0 0 0 0 | g = B-LOC

0 0 0 0 0 0 0 0 | h = B-ORG

我的测试和训练数据只包含名义数据和数字数据,arff 文件的标题是相同的,我没有从 Weka 收到任何错误消息。因此,我不知道我在哪里做错了什么以及我必须做什么才能得到结果。我尝试使用 Weka 版本 3-6 和版本 3-7-10,但结果始终相同。

有谁知道为什么我的测试集的评估不起作用?提前致谢!

4

1 回答 1

2

在我看来,也许 WEKA 不知道您的数据中哪个是类属性?在“分类”选项卡下的 Weka Explorer GUI 中,有一个用于选择类属性的下拉列表 - 确保选择了正确的类。

如果这不是问题,您是否确保您的测试数据有效并且可以在 WEKA 中处理?一个简单的测试是使用 WEKA 使用您的原始测试数据(例如作为临时训练数据)来训练模型。

于 2013-08-29T09:01:14.503 回答