0

我一直在 Cloudera 演示 VM 中试验 Mahout,并使用 k-Means 成功地对示例合成控制数据 (https://cwiki.apache.org/MAHOUT/clustering-of-synthetic-control-data.html) 进行聚类算法。我使用过 ClusterDumper 并且可以查看 Mahout 输出,但现在我想将输出放入 Hive 表中。我该怎么做呢?

4

2 回答 2

1

没有直接的整合。最好的办法是修改 ClusterDumper 以生成某种可以作为表格数据导入 Hive 的文本表示。

于 2012-07-19T03:14:31.070 回答
0

在 Hive 中创建一个外部表,它应该指向 Mahout o/p 路径。

于 2012-07-19T05:05:22.163 回答