我正在对 20NewsGroup 数据集进行文本分类,每个类别中有 100 个文档。我使用 10 倍交叉验证通过朴素贝叶斯对文本文档进行分类,它成功运行并在最后给我结果。
我用 10 倍交叉验证对 KNN 进行了同样的尝试,但它总是以“进程失败”结束,这表明它需要比可用内存更多的内存。我在 build.xml 和 rapidminerGUI.bat 中将 rapidminer 的堆空间从 1GB 增加到 2.5G,但没有任何改善(所以我认为堆空间不是问题),而且它总是需要更多的内存。
请帮助,我坚持下去并尝试了我能想到的所有可能的选择
平台详情:
操作系统:Windows 7(64 位) 软件版本:Rapidminer 5.3(64 位) Java:Java 1.7(64 位)