我正在寻找关于对猪拉丁脚本和配置单元脚本进行性能分析和改进的好教程。
问问题
645 次
2 回答
0
我不确定它是否是您正在寻找的东西,但大数据大学有一些关于 Hive 和 Pig 的非常好的教程。试一试。您将需要 IBM QuickStart VM。它的下载量很大,但它是免费的,而且相当不错。
链接: http ://www-01.ibm.com/software/data/infosphere/biginsights/quick-start/
VM 上的教程也很不错,但我认为 BigDataUni 的教程更好。
万一这很重要,我在两个网站上都注册了,没有收到任何垃圾邮件或任何东西。
于 2013-09-27T18:11:07.673 回答
0
我不知道有任何这样的教程。在我看来,唯一的好方法是自己做,牢记你的数据和你的案例。
话虽如此,您可以使用TPC-H之类的工具对查询进行基准测试,并根据结果改进和优化 Pig 和 Hive 查询,以防您发现一些性能瓶颈。这也将帮助您弄清楚 Pig 和 Hive 不擅长什么。此外,您可以比较这两种工具,以防您对特定任务使用哪个工具感到困惑。
您可以通过访问以下指定链接找到更多相关信息:
- 在 Pig Ticket上运行 TPC-H 基准测试。
- 在 Pig Ticket上运行 TPC-H 基准测试。
如果您需要所有详细信息,可以访问关于在Pig和Hive上运行 TPC-H的原始论文。这些文件包含大量信息,在此过程中您一定会发现它们很有帮助。
高温高压
于 2013-09-13T15:09:13.040 回答