0

我是 Hive 和 Hadoop 的新手,我想创建一个非常简单的演示来分析示例 twitts,如下所示:

T 2009-06-08 21:49:37 U http://twitter.com/blabla WI 认为数据挖掘很棒!

T 2009-06-08 21:49:37 U http://twitter.com/blublu WI 不这么认为。我不喜欢数据挖掘....一般可以这样做吗?但我不知道我应该从哪一点开始。你知道做这项工作的任何简单明了的参考吗?或者你能告诉我(不详细)我该怎么办?

4

1 回答 1

1

简而言之 - 您应该创建自己的 SerDe,它将以记录的形式呈现推文,然后您可以在 hive 中将推文作为表格处理。 https://cwiki.apache.org/Hive/developerguide.html#DeveloperGuide-SerDe

于 2012-06-05T12:24:24.660 回答