我从我的一位客户那里得到了要求。
要求是
source 是一个分隔符平面文件,分隔符是逗号(,)。源数据在数据中包含逗号。现在我想考虑该分隔符也是文本。这是示例源文件ex:
col1,col2,col3
10,usa,uk,hr
20,ind,aus,fin
30,europe,marketing
现在我的输出应该是这样的
不使用脚本任务我需要实现这个输出剩余的转换
提前致谢
以下屏幕截图显示了我的试验
使用引号作为文本限定符。IE
"20","ind,aus","fin"
"30","europe,"marketing"
文本限定符可以在平面文件连接管理器中定义。我认为 else 只是猜测工作,你将编写中断修复代码来处理从现在到世界末日的新场景。
如果您知道第一个和第三个字段始终只有一个值,并且介于两者之间的所有内容都属于第二个字段,则可以使用正则表达式。任何 etl 工具都应该允许您通过正则表达式解析 csv 文件。
以下
([^,]*),(.*),([^,]*)
适用于您提到的 4 个示例。
我不是正则表达式专家,我相信你可以让它更加坚实和优雅。