我经常使用lxml
Python 中的模块从一些网站上抓取数据,而且我对这个模块总体上很满意。但是,当我尝试抓取时,有时我会lxml.etree.XMLSyntaxError: AttValue: " or ' expected
在调用时遇到错误etree.fromstring()
,但通常不会。我无法澄清我看到该错误的频率,但我认为千分之一甚至数万次,我都会遇到该错误。当我在错误发生并且脚本停止后立即运行完全相同的脚本时,我看不到错误并且脚本按预期运行良好。为什么它偶尔会吐出一个错误?有没有办法处理这个问题?当我实例化 urllib2.urlopen() 函数时,我遇到了类似的问题,但是由于我最近没有看到错误urllib2
,所以我现在无法编写来自它的确切错误消息。
谢谢。