3

我需要将通过 Azure Data Lake Analytics (ADLA) 处理的数 TB 数据集导出到 SQL Server 数据库中。

根据我目前的研究,我知道我可以使用内置输出器将 (ADLA) 输出结果写入 Data Lake 存储或 WASB,然后使用 Polybase 从 SQL Server 读取输出数据。

但是,将 ADLA 处理的结果创建为 ADLA 表对我们来说似乎很诱人。它是一个干净的解决方案(无需管理文件)、多个读取器、内置分区、分布键以及允许其他进程访问表的潜力。

如果我们使用 ADLA 表,我可以通过 SQL Polybase 访问 ADLA 表吗?如果没有,有什么方法可以直接从 Polybase 访问 ADLA 表下的文件?

我知道我可能可以使用 ADF 来做到这一点,但在这一点上,我想尽可能避免使用 ADF - 以最大限度地降低成本并保持流程简单。

4

1 回答 1

4

不幸的是,Polybase 对 ADLA Tables 的支持仍在路线图上,尚不可用。请通过SQL 数据仓库用户语音页面提交功能请求。

建议的解决方法是在 ADLA 中将信息生成为 Csv,然后在 SQL DW 中创建分区和分布式表,并使用 Polybase 读取数据并填充 SQL DW 托管表。

于 2018-03-20T00:21:56.510 回答