现在最好的 Java 客户端,尤其是 Hadoop MapReduce,是通过 HBase API,是的。也就是说,客户端以标准 HBase 1.0+ Connection、Table 和 Admin 接口为目标。
要从 AWS 连接,您可以使用连接到 Cloud Bigtable中的步骤并设置额外的配置值来指定如何向 Cloud Bigtable 进行身份验证。至少,您需要指定服务帐户的电子邮件地址 (google.bigtable.auth.service.account.email) 和该服务帐户的 p12 文件的位置 (google.bigtable.auth.service. account.keyfile) 在 BigtableOptionsFactory 中定义。p12 密钥文件和 bigtable-hbase JAR 需要与作业一起分发(或之前部署到集群中)。您将其他作业部署到集群的工作流程将影响这些额外依赖项的部署方式。
至于部署,如果您使用的是 maven(或 ivy 等),可以通过com.google.cloud.bigtable组在 maven Central 下找到 bigtable-hbase jar 。HBase 1.0 和 1.1 都有工件。如果您使用 maven-assembly 或 maven-shade 插件,您可以将所需的工件与您的作业捆绑在一起。
另请注意,在 GCP / GCE 之外运行时,与 Cloud Bigtable 之间的延迟会因额外的网络跃点而增加。