1

我正在尝试在 pentaho 中处理一个固定宽度的输入文件并验证格式。该文件将是字符串、数字和日期的混合体。但是,当尝试处理存在不正确字符的数字字段时(我原以为会引发错误),它只会读取数字的第一部分并忽略错误的字符。

我可以使用包含单个字段的非常简单的输入文件重新创建此问题:

在此处输入图像描述

我指定了预期的数字格式,以及起始位置和长度: 在此处输入图像描述

在运行转换时,我预计“Q”会导致错误,而不是显示以下结果,只需读取前两位数字“67”并填充其余数字以匹配指定格式:

在此处输入图像描述

如果输入文件的格式正确,它运行得很好,但需要它抛出一个错误,否则。任何建议都会很棒。谢谢!

4

1 回答 1

1

仅供参考,以防有人在遇到与我相同的问题后偶然发现这个问题。

我能够通过将“文本文件输入”步骤中的所有值作为字符串读取,然后使用配备正则表达式评估的“数据验证器”步骤来构建一种解决方法,以确保在解析为数字类型之前正确格式化数字,并使用以下“选择值”步骤。

为每个领域执行此操作需要更长的时间,但这是我能想到的最强大的解决方案。

谢谢

于 2011-06-15T12:10:48.187 回答