0

我正在尝试在 Python 上使用 XPath 进行搜索,使用libxml2.parseFile. 出于某种原因,我无法对在线文件使用此功能:关于如何快速解决此问题的任何想法?

4

1 回答 1

0

我建议使用lxml,一个“C 库 libxml2 和 libxslt 的 Pythonic 绑定”

from lxml.html import parse
import urllib

SOURCE = 'http://stackoverflow.com/unanswered'

htmlpage = urllib.urlopen(SOURCE)
tree = parse(htmlpage).getroot()

print (tree.xpath('//div[1]'))

htmlpage.close()
于 2013-05-15T20:47:36.290 回答