hadoop - Mahout：如何使用随机森林进行在线预测

Question

在完成了这个简单的示例之后，我刚刚尝试了 UCI 玻璃数据的 BreimanExample：

我的问题是，一旦我在 Mahout 中创建了一个 RandomForest，我如何“加载”它以便用它进行预测？

使用 Python 中的 sklearn，这很容易，只需将森林腌制到磁盘并稍后加载，将其放在 Web 服务器后面进行实时交互，很容易。

但是 Mahout 和 Hadoop 呢？如果我大规模构建 RandomForest，我如何捕获并使用输出来进行未来预测？

score 1 · Accepted Answer

尝试按照以下示例进行操作：https: //cwiki.apache.org/MAHOUT/partial-implementation.html BuildForest 用于构建模型，TestForest 代码将向您展示如何加载模型以进行预测。

1 回答 1