0

使用正则表达式获取所有 HTML 元素是否有技巧?以这段 HTML 片段为例:

<div>
<p>test
<span>blub</span></p>
</div>

以正确的顺序如:

array(
0=>'<div>
<p>test
<span>blub</span></p>
</div>',

1=>'<p>test
<span>blub</span></p>'

2=>'<span>blub</span>'
)

我想到了一些东西

 (<([A-z]+)[^>]*>.*?</\2>)
4

2 回答 2

1

看看这个问题:regex match html element with html children

您无法真正使用正则表达式解析 HTML。使用 PHP 或其他语言来解析您的 HTML。

于 2012-12-19T23:36:41.020 回答
0

又快又脏

<[^>]+>

当您在其中包含带有 '>' 的字符串时,不要期望这会起作用。

于 2012-12-19T23:39:20.213 回答