我有一个接受通用 HTML 文件和通用 XPath 表达式的函数。我想提取包含整个文本(包括 HTML 标签)的匹配节点的字符串。这是一个简化的例子......
<?php
$inDocStg = "
<html><body>
<div>The best-laid<br> schemes o' <span>mice</span> an' men
<img src='./mouse.gif'><br>
</div>
</body></html>
";
$xPathDom = new DOMDocument();
@$xPathDom->loadHTML( $inDocStg );
$xPath = new DOMXPath( $xPathDom );
$matches = $xPath->query( "//div" );
echo $matches->item(0)->nodeValue;
?>
这会产生(我正在查看生成的 HTML 源 - 而不是浏览器输出)......
The best-laid schemes o' mice an' men
(HTML 标记已被剥离)。
但我想要的是...
The best-laid<br> schemes o' <span>mice</span> an' men<img src='./mouse.gif'><br>
谢谢。