我通常使用大型 XML 文件,并且通常通过字数grep
来确认某些统计数据。
例如,我想通过以下方式确保widget
在一个 xml 文件中至少有五个实例:
cat test.xml | grep -ic widget
此外,我只是希望能够记录widget
出现的行,即:
cat test.xml | grep -i widget > ~/log.txt
但是,我真正需要的关键信息是出现在其中的 XML 代码块widget
。示例文件可能如下所示:
<test> blah blah
blah blah blah
widget
blah blah blah
</test>
<formula>
blah
<details>
widget
</details>
</formula>
我试图从上面的示例文本中获取以下输出,即:
<test>widget</test>
<formula>widget</formula>
实际上,我试图获得具有最高级别标记标签的单行,这些标记标签适用于围绕任意字符串的 XML 文本/代码块,widget
.
有没有人有任何建议通过命令行一个班轮实现这一点?
谢谢你。