2

我想将基于 Hadoop 的 Mahout 推荐器与 Apache Hive 结合起来。这样我生成的推荐就直接存储在我的 Hive 表中。有没有人知道类似的教程。

4

1 回答 1

7

基于 Hadoop 的 Mahout 推荐器可以将结果直接存储在 HDFS 中。

Hive 还允许您在任何数据之上创建表模式,使用CREATE EXTERNAL TABLE recommend_table它还指定数据的位置 ( LOCATION '/home/admin/userdata';)。

这样,您可以确保当新数据写入该位置时 -/home/admin/userdata它已经可供 Hive 使用,并且可以通过现有Table架构进行查询:recommend_table。

前段时间我在博客上写过:external-tables-in-hive-are-handy。此解决方案有助于任何类型的 map-reduce 程序输出,这些输出需要立即用于 Hive ad-hoc 查询。

于 2012-06-23T16:55:54.107 回答