2

我想从一个网站(似乎是编码的<meta charset="iso-8859-15" />)解析所有城市。然后我想将它们导出为 CSV 文件,以便将它们保存在 Excel(Office for Mac 2016)中。我在我的 PHP 脚本中使用 Simple HTML DOM Parser。

首先,我在装有 Windows 的 PC 上编写了一个 PHP 脚本。CSV 文件正常,Excel 正确识别(Windows(ANSI) 格式)。这里没问题。

不过,这是我想在 Windows 和 Mac 上使用的脚本。在Mac上测试的时候,里面有很多特殊字符。这是我得到的城市示例:

巴黎 15ème
 奥尔日河畔布雷蒂尼
 巴黎 19ème
 巴黎 5ème
 阿让特伊
 圣芒代

我不明白为什么 'è' ( &egrave;) 是 HTML 格式,而 'é' 有很好的格式。

这是我收集城市的方式:

$place = str_replace('  ','',$lbc->find('div[class="placement"]',0)->plaintext);

要删除此编码问题,我尝试像这样使用 html_entity_decode:

$place = str_replace('','',html_entity_decode($lbc->find('div[class="placement"]',0)->plaintext));

这使得'è','ê',但是'é'字符不再是正常的工作,它们变成了?

我不知道如何处理这一切。

其他问题,当我尝试在 Excel Mac 2016 中导入 CSV 文件时,它无法识别格式。我必须使用 Sublime Text 2 打开 CSV 才能找到合适的格式,然后保存并最终将其导入 Excel for Mac。

4

0 回答 0