我有一个包含派生列的数据流任务。派生列将 CSV 文件列(例如订单号 A)转换为长度为 10 的数据类型 char。
当文本文件列等于或小于 10 个字符时,这非常有效。当然,A列订单号超过10个字符时会报错。
A 列(容易出错)。
12PR567890
254W895X98
ABC 56987K5239
485P971259 SPTGER
459745WERT
我想捕获容易出错的记录并仅提取订单号。
我已经可以配置派生列的错误输出。但是,这只是忽略错误记录并处理其他记录。
预期的输出将分别处理,ABC 56987K5239
订单485P971259 SPTGER
号。删除意外字符的过程并不重要,重要的是如何在派生列的运行时实现这一点(在出现错误时剥离和处理数据)。56987K5239
485P971259