好的 - 这远远超出了我对正则表达式的有限了解。我们收到来自银行实体的固定文本文件格式的报告。不幸的是,他们的系统会导出带有数据文件的页眉,在我们结束处理之前必须将其删除。页眉以相同的文本开始和结束,但内容会发生变化(日期和页码)。一个典型的看起来像:
00007xxxxx LAST1,FIRST1 111111 20120930
ABCD EXPORT RPT 10/04/12 at 10/04/12 16:20 Seq 1501 Page 16
MRK014 Report Date: 10/04/12
Acct# Name SH. Balance QTR (YYYYMMDD)
----------------------------------------------------------------------------------------------------
00007xxxxx LAST2,FIRST2 222222 20120930
所以每个标题都以“ABCD”开头(实际上是银行的名称,为了隐私,这里只是删除了)并以 -------------------- 行结束。
我需要把它归结为两行的客户数据(00007xxxxx - 这些帐号每人都会改变)。
所以我需要从“ABCD”到“---”的末尾进行选择以删除该文本块。