我环顾四周,只找到了 python 2.6 及更早版本的解决方案,没有关于如何在 python 3.X 中执行此操作。(我只能访问 Win7 框。)
我必须能够在 3.1 中做到这一点,最好没有外部库。目前,我已经安装了 httplib2 并可以访问命令提示符 curl(这就是我获取页面源代码的方式)。不幸的是,curl 不解码 html 实体,据我所知,我在文档中找不到解码它的命令。
是的,我试图让 Beautiful Soup 工作,很多时候在 3.X 中都没有成功。如果您能提供有关如何使其在 MS Windows 环境中的 python 3 中工作的明确说明,我将不胜感激。
所以,为了清楚起见,我需要把这样的字符串:Suzy & John
变成这样的字符串:“Suzy & John”。