0

目前在 mahout 中的 randomForest 实现不处理大数据中的缺失值,它只是简单地跳过所有包含缺失值的行。

如果我想利用这个源代码来识别大数据中的缺失值,我必须对源代码进行哪些修改?

谢谢,拉库马尔

4

1 回答 1

0

您可以通过设置不跳过不良记录来在 mapreduce 级别处理此问题。如果缺少值,它将使工作失败

于 2013-01-03T14:36:45.373 回答