我想将基于 Hadoop 的 Mahout 推荐器与 Apache Hive 结合起来。这样我生成的推荐就直接存储在我的 Hive 表中。有没有人知道类似的教程。
问问题
1865 次
1 回答
7
基于 Hadoop 的 Mahout 推荐器可以将结果直接存储在 HDFS 中。
Hive 还允许您在任何数据之上创建表模式,使用CREATE EXTERNAL TABLE recommend_table
它还指定数据的位置 ( LOCATION '/home/admin/userdata';
)。
这样,您可以确保当新数据写入该位置时 -/home/admin/userdata
它已经可供 Hive 使用,并且可以通过现有Table
架构进行查询:recommend_table。
前段时间我在博客上写过:external-tables-in-hive-are-handy。此解决方案有助于任何类型的 map-reduce 程序输出,这些输出需要立即用于 Hive ad-hoc 查询。
于 2012-06-23T16:55:54.107 回答