当我手动使用 BigQuery 控制台时,我可以看到将表导出到 GCS 时的 3 个选项是CSV
、JSON (Newline delimited)
和Avro
。
使用 Airflow,当使用操作符时,为了将数据传输到 GCS,BigQueryToCloudStorageOperator
传递给的正确值是什么?是不是很简单?我在网上看到的所有示例都用于use ,从不用于 JSON,所以我不确定这里的正确值是什么。我们的用例需要 JSON,因为 DAG 中的第二个任务(将数据传输到 GCS 之后)是然后将 GCS 中的数据加载到我们的 MongoDB 集群中。export_format
JSON (Newline delimited)
JSON
BigQueryToCloudStorageOperator
export_format='CSV'
mongoimport