我正在尝试通过数据融合管道将多个 csv 文件从 Azure 存储容器传输到 GCP 存储桶。
我可以通过提及 Azure blob 存储配置 wasbs://containername@storageaccountname.blob.core.windows.net/ CSVFile的“路径”字段的以下路径(特定 CSV 文件的完整路径)来成功传输单个文件.csv
但是,当我尝试从“contrainername”容器传输多个文件时,“路径”下方不起作用(这里我没有在“/”之后提及任何文件名,因为我需要传输此容器下的所有文件)
'wasbs://containername@storageaccountname.blob.core.windows.net/'
它抛出异常,因为' Spark program'phase-1' failed with error: / is not found。请检查系统日志以获取更多详细信息'
在这里,我使用“SAS 令牌”进行身份验证,该身份验证在容器级别生成,非常适合完整路径文件。
GCP管道中是否有任何Forloop选项来遍历文件?提前致谢
编辑:在容器级别生成的 SAS 令牌不适用于路径“/”。在存储帐户级别生成的 SAS 令牌可以选择该目录下的所有文件。但它将所有文件数据合并到一个文件中(在 GC 存储中生成)
任何人都可以帮助如何单独传输文件?谢谢