0

我一直使用漂亮的汤和 lxml.html 来解析 python 中的 html,但现在我面临着编写一个仅在标准库上运行的脚本。下一个最好的模块/技术是什么?

我准备接受它会比较差,即使我会失去使用 CSS 选择器的能力(哭泣!)问题是我需要它在任何旧的网络主机上运行,​​而他们只有标准库。

或者,我可以以某种方式手动安装 lxml 和 lxml.html 模块吗?即复制 /usr/share/pyshared/lxml 文件夹到我的服务器并使用 sys.path.insert 让我的脚本看到它?这很难看,但只要重写我的代码来解析没有两个事实上的标准库的 html 就行了!

我还没有尝试过,但我怀疑你在共享托管服务器上获得的 shell 是否允许我以更传统的方式安装 python 模块:使用“python setup.py install”或 pip 但如果你知道,请告诉我知道。

干杯,

罗杰 - 伦敦

4

1 回答 1

2

试试virtualenv,你可以在任何你喜欢的地方安装包。

cd ~
wget https://raw.github.com/pypa/virtualenv/master/virtualenv.py
python virtualenv.py newenv
cd newenv
source bin/activate
pip install lxml    
于 2012-11-15T02:28:02.627 回答