0
<div class="one">
    <a class="two" href="Something..."><img src="http://..."/></a>
    <p> stuff.... </p>
    <p><img src="http://....." /></p>
</div>

我有一个我正在解析的愚蠢的 HTML,你可以看到有一个名为 one 的主类另一个嵌套的名为two的主类。我正在尝试解析第一类中的所有图像但显然我拥有的 XPath 只捕获一张图像,这是来自第一类的图像

我试过这个:

//div[@class="one"]/img | //a[@class="two"]/img

但显然我没有从二班赶上但只有从一班才能做到这一点?

我正在使用 lxml.html 的 xpath 功能。

4

1 回答 1

1

试试这个Xpath表达式:

//div[@class="one"]//img

测试 :

xmllint --html --xpath '//div[@class="one"]//img' \
    'http://sputnick-area.net/ftp/downloads/testSO.html'

输出

<img src="http://...">
<img src="http://.....">
于 2012-10-10T00:37:54.083 回答