当我检查 RSS 提要时,在浏览器中我可以看到如下文本:
装扮,配上超短裙,露骨,也很随意。
但相同的源代码视图转换为十进制如下:
#30701裤、迷你裙、吊带装、人字拖鞋......大
987学生的穿着打扮及潮流品味,一直都是是大家讨论的
8909门话题。&
这是由于内容的本地化还是文件以不同的编码保存?我可以看到文件是使用 UTF-8 保存的。
我正在尝试使用 Python 解析 RSS 提要。但解析后,我只得到十进制值,而不是实际字符。