0

我有一些像这样的 utf-8 html:

<a href="http://example.com">Today&nbsp;11:12&nbsp;AM</a>

getElementsByTagName('a')->item(0)->nodeValue返回:

Today 11:12 AM

我在这个 html 中的其他节点没有任何问题。

我究竟做错了什么?

4

2 回答 2

0

尝试显式设置 DOMDocument 对象的编码:

$dom = new DOMDocument('1.0', 'UTF-8');
于 2012-04-06T19:24:35.560 回答
0

源文件是 ASP 和 IIS。

我最终将它用于有问题的角色:

str_replace( chr(), chr(), $html);
于 2012-07-29T17:14:31.630 回答