我试图在其他问题中找到答案,但没有一个“标准”答案有效,所以我希望有人可以指出我已经回答了这个问题,或者可以告诉我如何做到这一点。
我有一个包含多个文档的大文件。对于一个样本,假设是这样的
DOCUMENT_IDENTIFIER 123400000000000000000123457 OTHER STUFF HERE
LINE WITH STUFF HERE
LINE WITH STUFF HERE
DOCUMENT_IDENTIFIER 123500000000000000000127456 OTHER STUFF HERE
LINE WITH STUFF HERE
LINE WITH STUFF HERE
现在,我需要保留DOCUMENT_IDENTIFIER
从第一个 0 到123
(或127
第二个文档)标题行的行中的所有内容,加上LINE WITH STUFF HERE
它下面的所有行应该组成一个文档,并且一个新文档应该从第二DOCUMENT_IDENTIFIER
行。
当我尝试使用标准的 Debatching 技术时,管道失败:要么完全失败(例如,当我尝试为管道定义标题和正文模式时),要么它永远不会启动第二个文档(如果我尝试只是身体模式)。
我确定这是相当简单的事情,但我完全不知道如何完成它。欢迎任何建议/方向。
如果重要的话,我目前被困在 BT2006 R2 上。