我的背景——在 Hadoop 世界中已有 4 周的历史。使用 Cloudera 的 Hadoop VM 涉足 Hive、Pig 和 Hadoop。已阅读 Google 关于 Map-Reduce 和 GFS 的论文(PDF 链接)。
我明白那个-
Pig 的语言 Pig Latin 是从(适合程序员的思维方式)SQL 之类的声明式编程风格的转变,而 Hive 的查询语言与 SQL 非常相似。
Pig 位于 Hadoop 之上,原则上也可以位于 Dryad 之上。我可能错了,但 Hive 与 Hadoop 紧密耦合。
Pig Latin 和 Hive 命令都编译为 Map 和 Reduce 作业。
我的问题 - 当一个(比如猪)可以达到目的时,两者兼有的目标是什么。仅仅是因为 Pig 被 Yahoo! 传福音了吗?和 Facebook 的 Hive?