我使用 simple_html_dom.php 库从各种网页生成 RSS 提要。出于某种原因,我在 RSS 输出中出现了奇怪的字符。
例如,我正在抓取的网页包含以下 HTML:
WinJS – Comment utiliser les resources (et faire de la localization en bonus) | Communauté des Développeurs Windows 8
但在我的 RSS 提要中,它们显示为:
WinJS – Comment utiliser les resources (et faire de la localization en bonus) | Communauté des Développeurs Windows 8
我输出的 RSS 使用以下标头:
header("Content-Type: application/rss+xml; charset=ISO-8859-1");
我可以以某种方式正确显示文本吗?