我对 sed 很熟悉,但对 awk 不是很了解,也不知道如何解决这个问题。我已经用谷歌搜索了一段时间,但到目前为止还没有运气。情况如下:我有一个包含组和部分的大文件,如下所示:
<A1>
some nr of lines
</A1>
<A2>
some nr
of lines
</A2>
<B1>
some
nr of
lines
</B1>
<B2>
some nr of lines
</B2>
<B3>
bla
</B3>
<C1>
bla
</C1>
<C2>
bla
</C2>
现在的问题是组数可以改变,段数可以改变,每个段的行数可以改变。例如,A 部分可能会达到 25,B 部分可能会达到 8,依此类推。我需要做的是删除某些组的所有条目,在上面的示例中,我想删除 中的所有内容<B*>
,留下以下内容:
<A1>
some nr of lines
</A1>
<A2>
some nr
of lines
</A2>
<C1>
bla
</C1>
<C2>
bla
</C2>
此外,我想删除几个部分(尽管这些部分可以单独运行),例如,如果文件从 A1 转到 R123,我想删除 B*、F*、M* 等。
如果已经在某处询问并回答了类似的问题,我深表歉意,我确实在发布之前尝试找到解决方案。
谢谢!