我有一个用管道分隔的平面文件,看起来像这样
ColA|ColB|3*|注1|注2|注3|2**|A1|A2|A3|B1|B2|B3
前两列已设置并且将始终存在。
* 表示该计数之后将有多少重复字段的计数,因此注释 1 2 3
** 表示一个字段块重复的次数,一个块中总是有 3 个字段。
这是每行,因此每行可能有不同数量的字段。
希望到目前为止这是有道理的。
我正在尝试找到解析此文件的最佳方法,任何建议都会很棒。
最后的目标是将所有这些字段映射到几个不同的文件中——数据转换。我实际上是在 SSIS 中完成所有这些工作,但认为默认组件不够好,因此需要编写自己的代码。
更新我实际上是在尝试像读取源文件一样读取它,并对中间的一些字段进行一些查找和字符串操作,并像在任何普通文件到文件转换 SSIS 包中一样吐出几个不同的文件。
使用上面的示例,我可能想创建一个最终看起来像这样的新文件
"ColA","HardcodedString","Note1CRLFNote2CRLF","ColB"
然后另一个文件
第 1 行:“ColA”、“A1”、“A2”、“A3”
第 2 行:“ColA”、“B1”、“B2”、“B3”
所以我想我想知道如何解析这个以及将数据存储在堆栈或列表中还是?玩,以后吐出来。