我一直使用漂亮的汤和 lxml.html 来解析 python 中的 html,但现在我面临着编写一个仅在标准库上运行的脚本。下一个最好的模块/技术是什么?
我准备接受它会比较差,即使我会失去使用 CSS 选择器的能力(哭泣!)问题是我需要它在任何旧的网络主机上运行,而他们只有标准库。
或者,我可以以某种方式手动安装 lxml 和 lxml.html 模块吗?即复制 /usr/share/pyshared/lxml 文件夹到我的服务器并使用 sys.path.insert 让我的脚本看到它?这很难看,但只要重写我的代码来解析没有两个事实上的标准库的 html 就行了!
我还没有尝试过,但我怀疑你在共享托管服务器上获得的 shell 是否允许我以更传统的方式安装 python 模块:使用“python setup.py install”或 pip 但如果你知道,请告诉我知道。
干杯,
罗杰 - 伦敦