1

我有个问题。我的 FTP 位置上有一些 .zip 文件,我想解压缩并将它们复制到 ADLS。在文档中对此有明确的解释:

“从 FTP 服务器读取 .zip 文件,将其解压缩以获取其中的文件,然后将这些文件放入 Azure Data Lake Store。您可以将压缩类型 JSON 属性的输入 FTP 数据集定义为 ZipDeflate。”

我试过这个,在我的 ADLS 上我得到了压缩文件。我试图放置文件属性,定义分隔符和东西,并且仍然在数据湖存储中获取压缩文件。我认为这是我定义输出数据集的方式。如果输入数据集是来自 FTP 的 .zip 文件,是否有一些规则如何定义输出数据集。

4

1 回答 1

4

您很可能也将输出数据集的压缩定义为 ZipDeflate,这就是您在 ADLS 上获取压缩文件的原因。尝试更改您的输出数据集(与您在 ADLS 中配置路径的位置相同),使其不使用压缩。您应该在复制活动中包含配置 ftp 的输入数据集,使用压缩和输出数据集,您在其中配置湖的大部分内容,没有压缩。

这样,您就告诉数据工厂获取一个压缩文件,并将其解压缩到 ADLS 上。

希望这有帮助!

于 2018-04-16T11:42:53.370 回答