0

无论如何,我可以在使用 10 倍交叉验证进行文本分类后将我的预测结果路由回原始评论吗?

从类 non-sarc 和 sarc 的 2000 条评论的结果来看:

inst#,actual,predicted,error,prediction
1,2:non-sarc,2:non-sarc,,1
2,2:non-sarc,1:sarc,+,1
3,2:non-sarc,2:non-sarc,,1
4,2:non-sarc,2:non-sarc,,1
5,2:non-sarc,2:non-sarc,,1
.
.
101,1:sarc,1:sarc,,1
102,1:sarc,2:non-sarc,+,1
103,1:sarc,1:sarc,,1
104,1:sarc,1:sarc,,1
105,1:sarc,1:sarc,,1
.
.

看起来 weka 在等待培训和测试之前重新安排了我对班级划分的评论。我如何将此结果引用到未按顺序排列的原始评论(不像 10-fcv 之后)?我已经尝试将评论重新安排到非 sarc 和 sarc 的类序列,但我混淆了哪个测试/培训首先,是首先折叠测试,还是最后折叠测试,或其他?

提前致谢。

4

1 回答 1

0

由于没有人回答我的问题并且我已经想到了自己,希望这将有助于其他人遇到同样的问题。

  1. 在预处理中;过滤器>无监督;AddID 到属性,到第一个位置。这将为每个原始标签 [IDIndex: First] 提供 ID

1.添加IDIndex

  1. 在分类中;选择分类器。测试选项设置10-fcv,更多选项设置属性为1。链接和输出格式预测结果选择[attributes: 1]

2.属性与输出

  1. 开始/运行预测。输出显示实际标签和预测。错误用+标记,ID指的是预测前的原始标签。

3.输出

一切顺利!

于 2017-07-26T01:40:24.987 回答