我用以下 html 报废了一个网站
<a class="name" href="/link" data-hovercard-id="charshere"><span class="highlighted">War</span> World</a>
<a class="name" href="/link" data-hovercard-id="charshere"> World of <span class="highlighted">fun</span></a>
<a class="name" href="/link" data-hovercard-id="charshere">Save the<br>world</a>
<a class="name" href="/link" data-hovercard-id="charshere">world of warcraft</a>
使用此代码,我得到链接的值
preg_match_all('/<a class="name" href=".*?" data-hovercard-id=".*?">(.*)<\/a>/i', $file_string, $titles);
但结果是
<span class="highlighted">War</span> World
World of <span class="highlighted">fun</span>
Save the<br>world
world of warcraft
我如何忽略其中的 html 标签?所以它看起来像这样
War World
World of fun
Save the world
world of warcraft
DomDocument 可能会更好。谢谢。一直在尝试使用 domDocument,但我不熟悉如何使用它的 xquery。