我的 python 环境是 2.7
我知道这是一个老问题,但是当我搜索和阅读其他人的问题和答案时,我已经失去了理智。其中一些确实已经过时了。就像下面的代码:
import lxml #wrong
import xml #correct
所以,由于我是 python 的新手,对伟大的 python 历史一无所知,我想让事情更清楚。比如,现在python中所谓的标准xml-parser模块是什么?当我需要使用 xpath 语法解析一些 HTML 时,我该怎么办。如果我有一个格式错误的 HTML 源代码,如何不使用 BeautifulSoup 或其他类似的东西来处理它。如果你能向我介绍一些东西,我将不胜感激。
好吧,总而言之,我只有一个问题。如何使用带有 python2.7 的标准 python 模块来解析格式错误的 html 代码?