我正在尝试将下面的链接卷曲,该链接位于 GBK 中。我想提取产品和图像的标题。但是当我回显文件以测试它是否正常工作时,我没有得到汉字。我需要使用 domxpath 提取并在我的网站上显示字符,相同的字符,而不是奇怪的字符。这实际上是如何工作的?
$ch = curl_init("http://item.taobao.com/item.htm?spm=a2106.m874.1000384.41.aG3Kbi&id=20811635147&_u=o1ffj7oi9ad3&scm=1029.newlist-0.1.16&ppath=&sku=");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_BINARYTRANSFER, true);
$content = curl_exec($ch);
curl_close($ch);
$doc = new DOMDocument();
$searchPage = mb_convert_encoding($content, 'utf-8', "auto");
$doc->loadHTML($searchPage);
echo $doc->saveHTML();