1

我正在 Google API 中测试 BigQuery,并希望在 Wikipedia 全文转储上运行一些查询。Google 示例数据不包括全文转储(仅修订历史记录)。

维基百科转储的来源很少,例如亚马逊上的这个:http: //aws.amazon.com/datasets/2506

我的问题是:有没有办法在不将它们转移到 Google BigQuery 项目的情况下查询这些数据集?等效地,BigQuery 是否有一种方法可以直接与这些数据集之一进行通信?

如果 BigQuery 不可能,那么 Amazon EC2 中是否有可以做同样事情的等效服务?

谢谢你。

4

1 回答 1

1

有没有办法在不将它们转移到 Google BigQuery 项目的情况下查询这些数据库?

不会。BigQuery 针对 BigQuery 项目和数据集运行。

等效地,BigQuery 是否有一种方法可以直接与这些数据集之一进行通信?

等效地,没有。出于完全相同的原因。

如果 BigQuery 不可能,那么 Amazon EC2 中是否有可以做同样事情的等效服务?

不,不是。有 Amazon Cloud Search,但它基本上在相同的主体上运行,并要求您上传要搜索的数据。因此,除非某人已经将该数据上传到 Amazon Cloud Search 帐户,否则不上传数据是不可能的。

于 2013-01-14T20:33:03.727 回答