无论如何,我可以在使用 10 倍交叉验证进行文本分类后将我的预测结果路由回原始评论吗?
从类 non-sarc 和 sarc 的 2000 条评论的结果来看:
inst#,actual,predicted,error,prediction
1,2:non-sarc,2:non-sarc,,1
2,2:non-sarc,1:sarc,+,1
3,2:non-sarc,2:non-sarc,,1
4,2:non-sarc,2:non-sarc,,1
5,2:non-sarc,2:non-sarc,,1
.
.
101,1:sarc,1:sarc,,1
102,1:sarc,2:non-sarc,+,1
103,1:sarc,1:sarc,,1
104,1:sarc,1:sarc,,1
105,1:sarc,1:sarc,,1
.
.
看起来 weka 在等待培训和测试之前重新安排了我对班级划分的评论。我如何将此结果引用到未按顺序排列的原始评论(不像 10-fcv 之后)?我已经尝试将评论重新安排到非 sarc 和 sarc 的类序列,但我混淆了哪个测试/培训首先,是首先折叠测试,还是最后折叠测试,或其他?
提前致谢。