大家,早安。我有一个 GCS 存储桶,其中包含从我们的 Amazon S3 存储桶传输的文件。这些文件采用 .gz.parquet 格式。我正在尝试使用传输功能设置从 GSC 存储桶到 BigQuery 的传输,但是我遇到了 parquet 文件格式的问题。
当我创建传输并将文件格式指定为 Parquet 时,我收到一条错误消息,指出数据不是 Parquet 格式。当我尝试在 CSV 中指定文件时,奇怪的值出现在我的表中,如链接的图像所示:
我尝试了以下 URI:
存储桶名称/文件夹 1/文件夹 2/dt={run_time|"%Y-%m-%d"}/b=1/geo/*.parquet。文件格式:镶木地板。结果:文件不是拼花格式。
存储桶名称/文件夹 1/文件夹 2/dt={run_time|"%Y-%m-%d"}/b=1/geo/*.gz.parquet。文件格式:镶木地板。结果:文件不是拼花格式。
存储桶名称/文件夹 1/文件夹 2/dt={run_time|"%Y-%m-%d"}/b=1/geo/*.gz.parquet。文件格式:CSV。结果:转移完成,但价值很奇怪。
存储桶名称/文件夹 1/文件夹 2/dt={run_time|"%Y-%m-%d"}/b=1/geo/*.parquet。文件格式:CSV。结果:转移完成,但价值很奇怪。
有人对我应该如何进行有任何想法吗?先感谢您!