我是整个谷歌应用引擎和python开发环境的新手。但是,我过去有使用 c++、php 和 Objective-c 的经验。
我正在尝试编写显示数据的简单 html 刮板。我知道 lxml 是解析 html 的最佳方式。在我的开发环境中,我有 python 2.7,我似乎只能安装 lxml3.0.1。但是,应用引擎支持 lxml2.3
希望差异不会太严重,我在我的机器上安装了 lxml3.0.1。当我调用任何 lxml.html 解析器函数时,它会尝试从 html5lib 调用——这当然不受应用引擎的支持。
从谷歌应用引擎 lxml 解析 html 的最佳方法是什么?