我有一个正在处理的项目,我需要从特定的 div 标签中抓取文本,但只有文本没有 html 标签。
这是html的示例:
<div id="divid1" class="divclass1">
<h1>
TEXT INSIDE DIV
</h1>
</div>
我需要用 H1 标签刮掉 DIV 内的文本。我已经尝试了很多方法,但无法做到正确。
有什么建议么?谢谢!
我有一个正在处理的项目,我需要从特定的 div 标签中抓取文本,但只有文本没有 html 标签。
这是html的示例:
<div id="divid1" class="divclass1">
<h1>
TEXT INSIDE DIV
</h1>
</div>
我需要用 H1 标签刮掉 DIV 内的文本。我已经尝试了很多方法,但无法做到正确。
有什么建议么?谢谢!
使用 PHP domparser,这很适合这个目的。
我会使用 PHP Simple HTML DOM Parser。
http://simplehtmldom.sourceforge.net/
你可以说:
foreach ($html->find('div[divid1] h1') as $e)
echo $e->innertext;
这将回显 #divid1 内的 h1 标签内的文本(但不是标签本身)。
文档很简单,但有很多帮助:http: //simplehtmldom.sourceforge.net/manual.htm