1

我需要将数据从 hadoop 加载到 hive 自动,但我不想设置其他服务来做这件事。我已经用flume来收集我的日志了……那我该怎么办呢?水槽是否可以执行命令(像 LOAD 一样对 hive 的查询.....)?

4

2 回答 2

2

抱歉,我在这里聚会有点晚了,但实际上我已经整理了一个非常完整的示例,说明如何在所有细节都暴露出来的情况下做到这一点。也许,它会帮助别人

http://www.lopakalogic.com/articles/hadoop-articles/log-files-flume-hive/

祝你好运!

于 2014-02-11T15:21:54.833 回答
1

您可以让 Flume 将提取的数据存储在 Hive 的表目录下(通常是 /user/hive/warehouse/Your_Table_Dierctory)。没有什么需要做的了。

于 2013-08-29T03:36:42.830 回答