php - 获取汉字PHP源码

Question

好吧，我放弃了。我一直在想尽办法从具有繁体中文编码（charset = GB2312）信息的目标网站检索数据。

我一直像往常一样使用 simple_html_parser 但它似乎没有返回汉字，事实上我得到的只是一些嵌入菱形形状的奇怪问号。（“��ѯ�ؼ��֣�” 像这样）

声明 php 文件的编码除了删除页面开头显示的一些不需要的字符之外没有做任何事情。

通过声明它，我的意思是：

header('Content-Type', 'text/html; charset=GB2312');

我无法获得任何用中文编写的数据，也尝试file_get_contents过同样的运气。我可能遗漏了一些明显的东西，因为我在其他地方找不到任何相关的讨论。

提前致谢。

score 5 · Accepted Answer

您是否尝试过使用mb_convert_encoding或iconv转换编码，例如

$str = mb_convert_encoding($content, 'UTF-8', 'GB2312');

或者

$str = iconv("UTF-8", "GB2312//IGNORE", $content);

score 2 · Accepted Answer

以源使用的任何字符集获取它，然后将其转换为本地可用的字符，例如 UTF-8。然后发送到浏览器。

score -1 · Accepted Answer

-1

放header('Content-Type: text/html; charset=utf-8');

它对我有用

于 2014-08-02T10:14:02.777 回答

3 回答 3