1

我从我的一位客户那里得到了要求。

要求是

source 是一个分隔符平面文件,分隔符是逗号(,)。源数据在数据中包含逗号。现在我想考虑该分隔符也是文本。这是示例源文件ex:

col1,col2,col3

10,usa,uk,hr

20,ind,aus,fin

30,europe,marketing

现在我的输出应该是这样的

在此处输入图像描述

不使用脚本任务我需要实现这个输出剩余的转换

提前致谢

以下屏幕截图显示了我的试验这是配置后的平面文件预览

最后输出是这样的

4

2 回答 2

1

使用引号作为文本限定符。IE

"20","ind,aus","fin"
"30","europe,"marketing"

文本限定符可以在平面文件连接管理器中定义。我认为 else 只是猜测工作,你将编写中断修复代码来处理从现在到世界末日的新场景。

于 2014-09-26T16:21:18.693 回答
0

如果您知道第一个和第三个字段始终只有一个值,并且介于两者之间的所有内容都属于第二个字段,则可以使用正则表达式。任何 etl 工具都应该允许您通过正则表达式解析 csv 文件。

以下

([^,]*),(.*),([^,]*)

适用于您提到的 4 个示例。

我不是正则表达式专家,我相信你可以让它更加坚实和优雅。

于 2014-09-27T15:00:41.670 回答