0

我是 gcp 的新手。我的任务是下载专利数据集中的查询结果,但结果太大。我不能直接下载,因为gcp只支持下载16000行数据。

我选择了几列,数据已经太大了

SELECT country_code, kind_code, application_kind, family_id, publication_date, filing_date, cpc.code as cpc_code, ipc.code as ipc_code
FROM
`patents-public-data.patents.publications` p
cross join unnest(p.cpc) as cpc
cross join unnest(p.ipc) as ipc

我希望我可以下载结果表,或者通过 country_code 在不同的表中下载。

4

2 回答 2

1

为了补充@Christopher 的响应并实现您的下载,请执行以下步骤:

  • 执行您的查询
  • 将结果保存在(临时)表中
  • 将表提取到 Google 存储桶
  • 在控制台中手动或使用 gsutil 工具下载所需的文件

请注意,大小没有限制,但您可以拥有超过 1 个文件,结果是巨大的。注意嵌套字段的格式,更喜欢 gzip 压缩以加快下载速度!

于 2019-08-23T05:25:05.457 回答
0

您可以将结果写入另一个表或导出Cloud Storage 中的表数据(注意导出限制)

于 2019-08-23T04:13:20.867 回答