我需要将数据从 hadoop 加载到 hive 自动,但我不想设置其他服务来做这件事。我已经用flume来收集我的日志了……那我该怎么办呢?水槽是否可以执行命令(像 LOAD 一样对 hive 的查询.....)?
问问题
2441 次
2 回答
2
抱歉,我在这里聚会有点晚了,但实际上我已经整理了一个非常完整的示例,说明如何在所有细节都暴露出来的情况下做到这一点。也许,它会帮助别人
http://www.lopakalogic.com/articles/hadoop-articles/log-files-flume-hive/
祝你好运!
于 2014-02-11T15:21:54.833 回答
1
您可以让 Flume 将提取的数据存储在 Hive 的表目录下(通常是 /user/hive/warehouse/Your_Table_Dierctory)。没有什么需要做的了。
于 2013-08-29T03:36:42.830 回答