0

作为这个人,我有一个关于 weka 的问题:

大家好:

我对 WEKA 感到很奇怪。

我准备了一个包含很多缺失值的 CSV 文件。此文件中的一个缺失值是基本的,只是在一对逗号之间没有任何值,即,random_value1,,random_value2。这是格式的一个例子。您可以看到有一对逗号,它们之间没有任何东西,甚至没有空格,它应该表示数据的缺失值。

奇怪的是,当我将此 CSV 读入 WEKA 时,WEKA 会将所有缺失值分配给问号,即“?”。这正是 WEKA 的表达方式。

然后当我运行测试分析时,WEKA 开始研究这些“?” 作为某种有用的信息。它只是缺少值,WEKA 可以跳过它吗?

这些问题变得非常浪费。分析结果类似于如果缺失则值缺失,缺失与缺失相关,缺失与缺失相关。

WEKA 可以将缺失值读取为缺失值,而不是某种问号吗?或者我可以告诉 WEKA 对于所有“?”,将它们视为缺失值?

多谢你们

他使用这个解决方案解决了他的问题:

我找到了一种方法来告诉 WEKA 失踪的事情。只需使用 ASCII 编辑器的 fine_and_replace 功能,替换所有的 '?' 至 ?。

>

但我不知道如何下载 ASCII Editor 并使用它,谁能告诉我????

4

2 回答 2

2

我建议你在 windows 中使用 notepad2 或 notepad++。

于 2012-03-23T06:43:56.340 回答
0

您不必处理缺失值。不同的算法对缺失值的工作方式不同。所以,别担心,它会按照应有的方式处理。

于 2012-03-30T02:58:44.510 回答