我同时使用 Hive 和 MySQL(通过Google Cloud SQL),我想使用Presto轻松连接到两者。我已经看到 Cloud Dataproc 有一个Presto 初始化操作,但它不适用于开箱即用的 Cloud SQL。如何使该初始化操作与 Cloud SQL 一起使用,以便我可以将 Hive/Spark 和 Cloud SQL 与 Presto 一起使用?
问问题
429 次
1 回答
2
最简单的方法是编辑在 Cloud Dataproc 集群上安装 Presto 的初始化操作。
云 SQL 设置
但是,在您执行此操作之前,请确保配置 Cloud SQL,以便它可以与 Presto 一起使用。您将需要:
- 为 Presto 创建用户(或准备好用户)
- 调整任何必要的防火墙规则,以便您的 Cloud Dataproc 集群可以连接到 Cloud SQL 实例
更改初始化操作
在 Presto 初始化操作中有一个设置 Hive 配置的部分,如下所示:
cat > presto-server-${PRESTO_VERSION}/etc/catalog/hive.properties <<EOF
connector.name=hive-hadoop2
hive.metastore.uri=thrift://localhost:9083
EOF
您可以像这样(如下)添加一个新部分,用于设置 mysql 属性。添加如下内容:
cat > presto-server-${PRESTO_VERSION}/etc/catalog/mysql.properties <<EOF
connector.name=mysql
connection-url=jdbc:mysql://<ip_address>:3306
connection-user=<username>
connection-password=<password>
EOF
您显然想用正确的值替换<ip_address>
、<username>
和。<password>
此外,如果您有多个Cloud SQL 实例要连接,您可以添加多个部分并为它们指定不同的名称,只要文件名以.properties
.
于 2015-11-23T19:06:22.953 回答