python - libxml2.parseFile 用于在线文件？

翻译自：https://stackoverflow.com/questions/16574573 2013-05-15T20:40:55.333

394 次

0

我正在尝试在 Python 上使用 XPath 进行搜索，使用libxml2.parseFile. 出于某种原因，我无法对在线文件使用此功能：关于如何快速解决此问题的任何想法？

1 回答 1

0

我建议使用lxml，一个“C 库 libxml2 和 libxslt 的 Pythonic 绑定”：

from lxml.html import parse
import urllib

SOURCE = 'http://stackoverflow.com/unanswered'

htmlpage = urllib.urlopen(SOURCE)
tree = parse(htmlpage).getroot()

print (tree.xpath('//div[1]'))

htmlpage.close()

于 2013-05-15T20:47:36.290 回答