0

我下载了一个带有 cURL 的页面,并使用“PHP Simple HTML DOM Parser”解析了 html。问题是当它显示元素的外部 html 时,西班牙语字符不正确。例如:

原文

la puja por la compra de los derechos de publicación ha sido la más reñida del año。

显示的文字

la puja por la compra de los derechos de publicación ha sido la más reñida del año。

什么会导致字母改变?

4

3 回答 3

2

我很确定因为它在输出中显示为多个字符,这是因为您试图在单字节字符集中显示一些多字节 UTF8 字符(可能是 ISO-8859-1)。

看看我不久前写的这篇博客文章,它应该会告诉你所有潜在的问题领域。

于 2012-04-23T13:22:56.557 回答
1

不正确的字符编码 - 确保整个编码是一致的,我建议使用 UTF-8

于 2012-04-23T13:18:43.823 回答
0

您必须确定下载页面的编码是什么,然后(例如通过 iconv)将其转换为您的编码。

请参阅PHP:将 curl_exec 输出转换为 UTF8

于 2012-04-23T13:18:35.830 回答