也许我在谷歌搜索错误的关键字,但没有办法添加自定义标签,以便 DOMDocument 可以找到自定义标签。当我的 html 文件出现很多错误时,当然 getElementsByTagName 什么也不返回。
$dom = new DOMDocument();
$html = $dom->loadHTMLFile('my html file');
$dom->getElementsByTagName('un_welcome_text');
不会失败。我意识到这不是最佳实践,但是我必须解析的这段代码是无法更改的遗留代码。
html看起来像,我必须得到之间的一切
<body>
<u_top></u_top>
<u_welcome_text>
A BUNCH OF HTML
</u_welcome_text>
</body>