我的 html 解析器程序有问题。我的 html 有这样的标签,< p>
并且<p >
:空白给我带来了问题。
有没有一种简单的方法可以在单个 bash 命令中使用 sed 之类的东西来删除这些空格?
我的 html 解析器程序有问题。我的 html 有这样的标签,< p>
并且<p >
:空白给我带来了问题。
有没有一种简单的方法可以在单个 bash 命令中使用 sed 之类的东西来删除这些空格?
这是一个修剪无属性标签内的前导和尾随空格的方法。
$ echo '< p> </ p> <p > < /p>' | sed -E 's|<(/?) *([^ >]*) *>|<\1\2>|g'
<p> </p> <p> </p>
不,有太多的边缘情况,引号和转义字符会破坏你的结果。对于你得到的每一个答案,都有容易找到的例子可以打破它们。有关完整讨论,请参阅RegEx match open tags except XHTML self-contained tags。