0

我想获取 div 标签的内容。例如:

<div id="gameDetailsInner">
<div id="headerText" style="padding-left: 0px !important;padding-top: 0px !important;">
<h1><a href="http://www.abc.com/games.php?flash=7264">abc text</a></h1>
</div>
<div style="min-height: 90px;">
<a href="http://www.abc.com/games.php?param=12345"><img src="http://abc.abc.com/images/7264.jpg" alt="abc" width="120" height="78" id="gameDetailsInnerImg"/>
</a>
How can i get this text with regex?
</div>

谢谢...

4

3 回答 3

1

如果您使用 PHP,则可以使用该strip_tags()函数从字符串中删除所有 HTML 标记。

除此之外,您还需要使用适当的 HTML 解析器。您无法使用正则表达式解析 HTML。您需要使用适当的 HTML 解析器。http://htmlparsing.com列出了许多针对不同语言的解决方案。

于 2012-12-14T20:44:07.817 回答
1

不幸的是,您不能使用正则表达式可靠地解析 HTML。有关详细信息,请参阅这个著名的问题:RegEx match open tags except XHTML self-contained tags

于 2012-12-14T20:49:34.070 回答
0
<div.*>([^>]+)</div>

div如果内容就在结尾之前,Group1给出的内容</div>

于 2012-12-15T13:10:54.327 回答