1

我正在使用 lxml 来获取 html 页面。
我想获取类名为“class1”的html表。
我做了这样的事情:

for span in doc.xpath('//table[@class="class1"]'):
print span

但是,
在此之后,我发现 HTML 页面中有 4 个表的类名为“class1”。
例如 :

table A
table B
table C
table D

这 4 个表都具有相同的类名。
我如何只能获取表 B?

4

2 回答 2

3

您可以获得列表的第二项:

结果 = doc.xpath('//table[@class="class1"]')
如果 len(结果)> 1:
  打印结果[1]

或者,如果您的表有 id,您可以通过 xpath 获取它:

print doc.xpath('//table[@id="you id"]')[0]
于 2012-04-18T04:47:27.920 回答
2

我想你可能想要的是...

doc.xpath('//table[@class="class1"]')[1]
于 2012-04-18T04:49:10.570 回答