在完成了这个简单的示例之后,我刚刚尝试了 UCI 玻璃数据的 BreimanExample:
https://cwiki.apache.org/MAHOUT/breiman-example.html
我的问题是,一旦我在 Mahout 中创建了一个 RandomForest,我如何“加载”它以便用它进行预测?
使用 Python 中的 sklearn,这很容易,只需将森林腌制到磁盘并稍后加载,将其放在 Web 服务器后面进行实时交互,很容易。
但是 Mahout 和 Hadoop 呢?如果我大规模构建 RandomForest,我如何捕获并使用输出来进行未来预测?