hadoop - 将集群数据从 HDFS 移动到 Hive

Question

我一直在 Cloudera 演示 VM 中试验 Mahout，并使用 k-Means 成功地对示例合成控制数据 (https://cwiki.apache.org/MAHOUT/clustering-of-synthetic-control-data.html) 进行聚类算法。我使用过 ClusterDumper 并且可以查看 Mahout 输出，但现在我想将输出放入 Hive 表中。我该怎么做呢？

score 1 · Accepted Answer

没有直接的整合。最好的办法是修改 ClusterDumper 以生成某种可以作为表格数据导入 Hive 的文本表示。

score 0 · Accepted Answer

0

在 Hive 中创建一个外部表，它应该指向 Mahout o/p 路径。

于 2012-07-19T05:05:22.163 回答

hadoop - 将集群数据从 HDFS 移动到 Hive

2 回答 2

Related

Reference