2

我正在尝试使用简单的 HTML DOM ( http://simplehtmldom.sourceforge.net ) 解析一个中文网站,但面临的问题是所有解析的中文字符都变成了无法识别的符号。

例子:“星洲网”变成了“æ~Ÿæ´²ç¶²”

如何使用 Simple HTML DOM 解析 UTF-8 字符?或者我在编码中做错了什么?

下面是我的 PHP 编码:

<?php
require_once ("simple_html_dom.php");

$html = file_get_html("http://www.sinchew-i.com");
print $html->plaintext;
?>
4

1 回答 1

0
header('Content-Type: text/html; charset=utf-8');

Check this Handling unicode

于 2014-03-04T07:36:48.407 回答