我有一个非常基本的 html 文件,名为example.html
(见下文)
<html>
<body>
<div class="one">
<div class="research">
<div class="two">
<p>Lorem ipsum...</p>
</div>
<div class="three">
<p>Lorem ipsum...</p>
</div>
<div class="four">
<p>Lorem ipsum...</p>
</div>
</div>
</div>
</body>
</html>
我只想得到类似的短语(见下文),而不是通过删除第一行和最后 3 行。
<div class="research">
<p>Lorem ipsum...</p>
<div class="two"></div>
<div class="three"></div>
<div class="four"></div>
</div>
我试过了awk
:
cat example.html | awk '/^<div\ class="research">$/,/^<\/div>$/ { print }'
但似乎有些不对劲。
我也试过body
标签(见下文)
cat example.html | awk '/^<body>$/,/^<\/body>$/ { print }'
(结果)
<body>
<div class="one">
<div class="research">
<div class="two">
<p>Lorem ipsum...</p>
</div>
<div class="three">
<p>Lorem ipsum...</p>
</div>
<div class="four">
<p>Lorem ipsum...</p>
</div>
</div>
</div>
</body>
它工作正常。
我做错了什么?
提前致谢。