我正在尝试在 Data Fusion 中设置一个非常简单的管道,该管道从 BigQuery 获取一个表,然后将该数据存储到 Google Cloud Storage 中。通过下面的管道设置,它相当容易。我们首先读取 bigquery 表和架构,然后将数据放入 Google Cloud Storage 存储桶中。这可行,但问题是我运行的每个新传输都会创建一个新地图和一个新文件。我想做的是用我所做的每次新传输覆盖同一文件路径中的单个文件。
我在这个设置中遇到的问题是,一个新地图和一个新文件会在使用时间戳前缀创建的 Google Cloud Storage 中获取。查看下面的接收器配置,事实上,默认情况下您会看到一个时间戳。
好吧,这意味着如果我删除前缀,则不应创建新地图。悬停确认了这一点:“如果未指定,则不会将任何内容附加到路径”。
但是,当我清除此值然后保存时,全时格式会再次自动弹出。我不能使用静态值,因为这会导致错误。例如,我刚刚尝试在 Google Cloud Storage 中创建一个编号为“12”的地图,然后将前缀设置为此,但正如您所猜测的那样,这不起作用。还有其他人遇到这个问题吗?如何摆脱路径后缀,这样我就不会为 Google Cloud Storage 中的每个时间戳获取新地图?