我以交互模式在弹性 mapreduce 上运行 Hive:
./elastic-mapreduce --create --hive-interactive
在脚本模式下:
./elastic-mapreduce --create --hive-script --arg s3://mybucket/myfile.q
我希望在我自己的服务器上拥有一个应用程序(最好是 PHP、R 或 Python),能够启动弹性 mapreduce 集群并运行多个 Hive 命令,同时以可解析的形式获取它们的输出。
我知道启动集群可能需要一些时间,所以也许我的应用程序可能需要在单独的步骤中执行此操作并等待集群准备好。但是有没有办法做这样的事情,比如这个有点具体的假设例子:
- 创建 Hive 表 customer_orders
- 运行 Hive 查询“SELECT dt, count(*) FROM customer_orders GROUP BY dt”
- 等待结果
- 在 PHP 中解析结果
- 运行 Hive 查询“SELECT MAX(id) FROM customer_orders”
- 等待结果
- 在 PHP 中解析结果...
有人对我如何做到这一点有任何建议吗?