我的源具有不同的日期格式,如下所示,我正在寻找一种算法来识别在 Pentaho Data 集成中尝试的源日期模式,其中包含选择值和模糊步骤。
日期列(字符串)
“20150210”
“20050822--”
“2014-02-May”
“20051509--”
“02-May-2014”
“2013-May-12”
“12DEC2013”
“15050815”
“May-02- 2014"
"12312015"
我知道在 PDI 中,我们可以通过 JS 一步来通过为每个模式编写 If 条件来实现,但这不是一个好主意,这种方法在处理大量记录时会导致转换失效,寻找搜索日期模式的有效方法。
我相信这是所有 ETL 项目中非常常见的问题,在这里我试图了解 SAS 数据集成、Informatica、SSIS 等企业供应商如何提供简单的处理方法。
我们是否有任何算法来识别源模式。如果有,是哪一个?
上面列出的格式不受限制。