0

我正在尝试通过数据融合管道将多个 csv 文件从 Azure 存储容器传输到 GCP 存储桶。

我可以通过提及 Azure blob 存储配置 wasbs://containername@storageaccountname.blob.core.windows.net/ CSVFile的“路径”字段的以下路径(特定 CSV 文件的完整路径)来成功传输单个文件.csv

但是,当我尝试从“contrainername”容器传输多个文件时,“路径”下方不起作用(这里我没有在“/”之后提及任何文件名,因为我需要传输此容器下的所有文件)

'wasbs://containername@storageaccountname.blob.core.windows.net/'

它抛出异常,因为' Spark program'phase-1' failed with error: / is not found。请检查系统日志以获取更多详细信息'

在这里,我使用“SAS 令牌”进行身份验证,该身份验证在容器级别生成,非常适合完整路径文件。

GCP管道中是否有任何Forloop选项来遍历文件?提前致谢


编辑:在容器级别生成的 SAS 令牌不适用于路径“/”。在存储帐户级别生成的 SAS 令牌可以选择该目录下的所有文件。但它将所有文件数据合并到一个文件中(在 GC 存储中生成)

任何人都可以帮助如何单独传输文件?谢谢

4

0 回答 0