我正在尝试将数据从我的外部表加载到 SQL DW 内部表。我在 BLOB 存储中以压缩格式存储数据,外部表指向 BLOB 存储位置。
我有大约 24 个文件,大小约为 22GB,并尝试使用更大的资源类服务/用户帐户将数据从外部表加载到 300 DWU 上的内部表。
我的 insert into 语句(非常简单)运行了 10 多个小时。插入 Trxdata.Details_data 从 Trxdata.Stage_External_Table_details_data 中选择 *;
我还尝试了以下语句,这也运行了 10 多个小时。创建表 Trxdata.Details_data12 WITH (DISTRIBUTION = ROUND_ROBIN) AS SELECT * FROM Trxdata.Stage_External_Table_details_data;
我明白了 - 两个 SQL 都在“sys”中以 ACTIVE 状态运行。“dm_pdw_exec_requests” [我在想,这可能是并发槽问题,它没有运行并发槽,但事实并非如此]
我希望,增加/扩大 DWU - 可能会提高性能。但查看 portal.azure.com 中的 DWU 使用情况 - 我不相信会增加 DWU,因为 DWU 使用情况图表显示过去 12 小时 <50DWU
所以,我想了解 - 我怎么能找到 - 什么需要这么长时间,我怎样才能提高我的数据加载的性能?