2

我从https://cloud.google.com/hadoop/datastore-connector获得了连接器 但我正在尝试将datastore-connector(以及bigquery-connector)添加为 pom 中的依赖项......我不知道这是否可能. 我找不到正确的工件和 groupId。

是否有一些 Maven 存储库包含datastore-connector

此外,我正在寻找 的来源datastore-connector,但我没有找到它。根据 中的注释CHANGES.txt,它似乎来自:

https://github.com/GoogleCloudPlatform/bigdata-interop

源代码应该在包com.google.cloud.hadoop.io.datastore( src/main/***/com/google/cloud/hadoop/io/datastore/) 中,但它不存在。

事实上,来源bigquery-connector似乎和它的pom一起在GitHub 上,但是来源是否可用?datastore-connector

4

2 回答 2

1

大卫在另一个答案中所说的是正确的。更详细地说,引擎盖下的连接器使用Protocol Buffers SDK,并使用例如QuerySplitter来定义拆分。在不久的将来,我们将向gcp-hadoop-announce发布更多信息,并提供有关 Hadoop 数据存储连接器未来的进一步指导。

您可能希望熟悉其他可能更适合您的目的的 Datastore 功能,包括将Datastore 备份到 GCS,以及本 Codelab 介绍了一种 AppEngine 友好的方法来从 Datastore 中提取数据并将其加载到 BigQuery 中进行分析。您可能会在该页面顶部注意到受信任的测试人员可用于将 Datastore 备份直接后端加载到 BigQuery 的公告。

于 2015-02-05T02:05:29.703 回答
1

数据存储连接器源不可用,工件也没有 maven 存储库。您最好的选择是在源代码树中创建一个本地 raven 存储库,如这篇有用的文章中所述。

于 2015-02-03T23:38:45.563 回答