我想知道是否有任何提示和技巧可以在数据湖分析工作中发现错误。错误消息似乎大部分时间都不是很详细。
尝试从 CSV 文件中提取时,我经常收到这样的错误
顶点失败触发快速作业中止。顶点失败:SV1_Extract[0] with >error:顶点用户代码错误。
顶点因快速失败错误而失败
尝试将列转换为指定类型时似乎会发生这些错误。
我发现的技术是将所有列提取为字符串,然后执行 SELECT 尝试将列转换为预期类型。逐列执行这些操作可以帮助找到错误的特定列。
@data =
EXTRACT ClientID string,
SendID string,
FromName string,
FROM "wasb://..."
USING Extractors.Csv();
//convert some columns to INT, condition to skip header
@clean =
SELECT Int32.Parse(ClientID) AS ClientID,
Int32.Parse(SendID) AS SendID,
FromName,
FROM @data
WHERE !ClientID.StartsWith("ClientID");
是否也可以使用 TryParse 之类的东西在解析错误的情况下返回 null 或默认值,而不是整个作业失败?
谢谢