作为这个人,我有一个关于 weka 的问题:
大家好:
我对 WEKA 感到很奇怪。
我准备了一个包含很多缺失值的 CSV 文件。此文件中的一个缺失值是基本的,只是在一对逗号之间没有任何值,即,random_value1,,random_value2。这是格式的一个例子。您可以看到有一对逗号,它们之间没有任何东西,甚至没有空格,它应该表示数据的缺失值。
奇怪的是,当我将此 CSV 读入 WEKA 时,WEKA 会将所有缺失值分配给问号,即“?”。这正是 WEKA 的表达方式。
然后当我运行测试分析时,WEKA 开始研究这些“?” 作为某种有用的信息。它只是缺少值,WEKA 可以跳过它吗?
这些问题变得非常浪费。分析结果类似于如果缺失则值缺失,缺失与缺失相关,缺失与缺失相关。
WEKA 可以将缺失值读取为缺失值,而不是某种问号吗?或者我可以告诉 WEKA 对于所有“?”,将它们视为缺失值?
多谢你们
他使用这个解决方案解决了他的问题:
我找到了一种方法来告诉 WEKA 失踪的事情。只需使用 ASCII 编辑器的 fine_and_replace 功能,替换所有的 '?' 至 ?。
>
但我不知道如何下载 ASCII Editor 并使用它,谁能告诉我????