我正在尝试使用简单的 HTML DOM ( http://simplehtmldom.sourceforge.net ) 解析一个中文网站,但面临的问题是所有解析的中文字符都变成了无法识别的符号。
例子:“星洲网”变成了“æ~Ÿæ´²ç¶²”
如何使用 Simple HTML DOM 解析 UTF-8 字符?或者我在编码中做错了什么?
下面是我的 PHP 编码:
<?php
require_once ("simple_html_dom.php");
$html = file_get_html("http://www.sinchew-i.com");
print $html->plaintext;
?>