我正在尝试在 Python 上使用 XPath 进行搜索,使用libxml2.parseFile
. 出于某种原因,我无法对在线文件使用此功能:关于如何快速解决此问题的任何想法?
问问题
394 次
1 回答
0
我建议使用lxml,一个“C 库 libxml2 和 libxslt 的 Pythonic 绑定”:
from lxml.html import parse
import urllib
SOURCE = 'http://stackoverflow.com/unanswered'
htmlpage = urllib.urlopen(SOURCE)
tree = parse(htmlpage).getroot()
print (tree.xpath('//div[1]'))
htmlpage.close()
于 2013-05-15T20:47:36.290 回答