0

我只是在浏览一些 Microsoft 文档并为与数据工程相关的事情做手把手。我有几个关于场景的查询-“将 CSV 文件从 Blob 存储复制到 Synapse 分析(暂存表):

我读到我们可以通过创建外部表的过程直接在 Synapse 中提取数据。(https://docs.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/load-data-wideworldimportersdw

如果上述是可能的,那么在什么情况下我们会使用 Azure 数据工厂复制或数据流方法?在使用 Azure 数据工厂时,使用 Polybase 是否是个好主意,因为它将再次使用 Blob 存储作为此场景中的暂存(即我仅从 Blob 复制文件并再次使用 Blob 进行暂存)?

我搜索了我的查询的答案,但还没有找到任何令人满意的答案。

4

1 回答 1

0

如果您只是直接将数据从 CSV 加载到 DW,请使用 Copy。建议使用 Polybase,但小文件并不总是需要。

如果您需要转换该数据或执行更新,请使用数据流。

于 2020-08-03T23:56:41.643 回答