2

我的 html 解析器程序有问题。我的 html 有这样的标签,< p>并且<p >:空白给我带来了问题。

有没有一种简单的方法可以在单个 bash 命令中使用 sed 之类的东西来删除这些空格?

4

2 回答 2

3

这是一个修剪无属性标签内的前导和尾随空格的方法。

$ echo '< p> </ p> <p > < /p>' | sed -E 's|<(/?) *([^ >]*) *>|<\1\2>|g'
<p> </p> <p> </p>
于 2013-04-21T00:03:20.553 回答
0

不,有太多的边缘情况,引号和转义字符会破坏你的结果。对于你得到的每一个答案,都有容易找到的例子可以打破它们。有关完整讨论,请参阅RegEx match open tags except XHTML self-contained tags

于 2013-04-21T00:05:15.703 回答