python - 使用lxml在HTML解析中具有相同类名的多个表

Question

我正在使用 lxml 来获取 html 页面。
我想获取类名为“class1”的html表。
我做了这样的事情：

for span in doc.xpath('//table[@class="class1"]'):
print span

但是，
在此之后，我发现 HTML 页面中有 4 个表的类名为“class1”。
例如：

table A
table B
table C
table D

这 4 个表都具有相同的类名。
我如何只能获取表 B？

score 3 · Accepted Answer

您可以获得列表的第二项：

结果 = doc.xpath('//table[@class="class1"]')
如果 len（结果）> 1：
  打印结果[1]

或者，如果您的表有 id，您可以通过 xpath 获取它：

print doc.xpath('//table[@id="you id"]')[0]

score 2 · Accepted Answer

2

我想你可能想要的是...

doc.xpath('//table[@class="class1"]')[1]

于 2012-04-18T04:49:10.570 回答

2 回答 2