php - 简单的 HTML DOM 抓取字符编码问题

翻译自：https://stackoverflow.com/questions/10776731 2012-05-27T19:44:44.057

907 次

我正在尝试从网站上抓取一些内容，通常效果很好。然而，这一次，当我抓取内容时，我得到了大量的字符，带有问号的小菱形。

我正在抓取的网站和我自己的网站都使用 UTF-8 作为编码。奇怪的是，我可以很好地抓取该站点的主页，但每当我尝试抓取不同的页面时，一切都会变得一团糟，即使这些页面也使用 UTF-8。为了简单起见，我只调用了 file_get_html() ，然后调用了一个简单的 echo $html->plaintext 所以我的编码应该没有错误。

有谁知道如何解决这个问题？提前致谢

php - 简单的 HTML DOM 抓取字符编码问题

0 回答 0

Related

Reference