weka - 如何将 10-fcv weka 预测结果链接回原始评论以进行文本分类

Question

无论如何，我可以在使用 10 倍交叉验证进行文本分类后将我的预测结果路由回原始评论吗？

从类 non-sarc 和 sarc 的 2000 条评论的结果来看：

inst#,actual,predicted,error,prediction
1,2:non-sarc,2:non-sarc,,1
2,2:non-sarc,1:sarc,+,1
3,2:non-sarc,2:non-sarc,,1
4,2:non-sarc,2:non-sarc,,1
5,2:non-sarc,2:non-sarc,,1
.
.
101,1:sarc,1:sarc,,1
102,1:sarc,2:non-sarc,+,1
103,1:sarc,1:sarc,,1
104,1:sarc,1:sarc,,1
105,1:sarc,1:sarc,,1
.
.

看起来 weka 在等待培训和测试之前重新安排了我对班级划分的评论。我如何将此结果引用到未按顺序排列的原始评论（不像 10-fcv 之后）？我已经尝试将评论重新安排到非 sarc 和 sarc 的类序列，但我混淆了哪个测试/培训首先，是首先折叠测试，还是最后折叠测试，或其他？

提前致谢。

score 0 · Accepted Answer

由于没有人回答我的问题并且我已经想到了自己，希望这将有助于其他人遇到同样的问题。

在预处理中；过滤器>无监督；AddID 到属性，到第一个位置。这将为每个原始标签 [IDIndex: First] 提供 ID

在分类中；选择分类器。测试选项设置10-fcv，更多选项设置属性为1。链接和输出格式预测结果选择[attributes: 1]

开始/运行预测。输出显示实际标签和预测。错误用+标记，ID指的是预测前的原始标签。

一切顺利！

weka - 如何将 10-fcv weka 预测结果链接回原始评论以进行文本分类

1 回答 1

Related

Reference