我正在遵循这个问题 Robust, Mature HTML Parser for PHP的建议,关于解析可能与DOMDocument格式错误的 html 。
有没有简单的方法来遍历解析的文档?所以我想像这样循环遍历html。
$html='<ul>
<li>value1</li>
<li>value1</li>
<li>value3
<p>subvalue</p>
</li>
</ul>
<p>hello world</p>';
$doc = new DOMDocument();
$doc->loadHTML($html);
???
foreach (??? as $node)
{
print $node->nodeName.':'.$node->nodeValue;
}
得到的结果有点像这样。
ul:
li:value1
li:value2
li:value3
p:subvalue
p:hello world
单独使用$doc->childNodes
并不能真正做到我想要的。因为它似乎不会下降到树的较低树枝上。我使用了halfdan建议的代码,得到了这样的结果。
html:
html:value1
value1
value3
subvalue
hello world