Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
目前在 mahout 中的 randomForest 实现不处理大数据中的缺失值,它只是简单地跳过所有包含缺失值的行。
如果我想利用这个源代码来识别大数据中的缺失值,我必须对源代码进行哪些修改?
谢谢,拉库马尔
您可以通过设置不跳过不良记录来在 mapreduce 级别处理此问题。如果缺少值,它将使工作失败