我正在尝试从网站上抓取一些内容,通常效果很好。然而,这一次,当我抓取内容时,我得到了大量的字符,带有问号的小菱形。
我正在抓取的网站和我自己的网站都使用 UTF-8 作为编码。奇怪的是,我可以很好地抓取该站点的主页,但每当我尝试抓取不同的页面时,一切都会变得一团糟,即使这些页面也使用 UTF-8。为了简单起见,我只调用了 file_get_html() ,然后调用了一个简单的 echo $html->plaintext 所以我的编码应该没有错误。
有谁知道如何解决这个问题?提前致谢
我正在尝试从网站上抓取一些内容,通常效果很好。然而,这一次,当我抓取内容时,我得到了大量的字符,带有问号的小菱形。
我正在抓取的网站和我自己的网站都使用 UTF-8 作为编码。奇怪的是,我可以很好地抓取该站点的主页,但每当我尝试抓取不同的页面时,一切都会变得一团糟,即使这些页面也使用 UTF-8。为了简单起见,我只调用了 file_get_html() ,然后调用了一个简单的 echo $html->plaintext 所以我的编码应该没有错误。
有谁知道如何解决这个问题?提前致谢