检索网页时(不是我自己的)。XPath 返回奇怪的字符。使用时
iconv("UTF-8","ISO-8859-1",$xpath_results->item(0)->nodeValue)
都很好。但是,每次都必须这样做并不是很整洁。返回的 html 如下所示:
第 26 周 Huiswerkklas hele 周 aanvang 13.30 uur Dinsdag 26 六月 Vergadering feetcommissie 10.00 uur Lok.9
如何在加载网页时设置正确的编码,而不是每次导出时都这样做。
在寻找类似问题时,我尝试了以下方法:
$uitval_document->loadHTML('<?xml encoding="UTF-8">'.file_get_contents(BASE_URL_uitval68.$value->getAttribute('href')));
这当然不起作用,因为它是 HTML 而不是我正在检索的 XML。在 HTML 中,编码将放在 head 标签中。因此可以加载 HTML 并将其添加到 headtag,并使用正确的编码重新加载它。但这不是很有效而且很老套。你们知道更好的解决方案吗?