我已经为我想要的 URL 打开了 scrapy shell,并试图选择 p 标签的所有实例,例如:
<div class="foo"><p>Blah</p></div>
但似乎存在不匹配,我无法获得这些标签的所有实例。
In [12]: len(hxs.re("<div class=\"foo"))
Out[12]: 13
In [13]: len(hxs.select('//div[contains(@class, "foo")]'))
Out[13]: 1
事实上,我根本无法使用 XPath 获得 p 标记的完整说明......
In [14]: len(hxs.select('//p'))
Out[14]: 6
我错过了什么?我认为第 [14] 行会给出文档中 p 标记的所有实例。