我正在 Google API 中测试 BigQuery,并希望在 Wikipedia 全文转储上运行一些查询。Google 示例数据不包括全文转储(仅修订历史记录)。
维基百科转储的来源很少,例如亚马逊上的这个:http: //aws.amazon.com/datasets/2506
我的问题是:有没有办法在不将它们转移到 Google BigQuery 项目的情况下查询这些数据集?等效地,BigQuery 是否有一种方法可以直接与这些数据集之一进行通信?
如果 BigQuery 不可能,那么 Amazon EC2 中是否有可以做同样事情的等效服务?
谢谢你。