Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在使用 lxml 来获取 html 页面。 我想获取类名为“class1”的html表。 我做了这样的事情:
for span in doc.xpath('//table[@class="class1"]'): print span
但是, 在此之后,我发现 HTML 页面中有 4 个表的类名为“class1”。 例如 :
table A table B table C table D
这 4 个表都具有相同的类名。 我如何只能获取表 B?
您可以获得列表的第二项:
结果 = doc.xpath('//table[@class="class1"]') 如果 len(结果)> 1: 打印结果[1]
或者,如果您的表有 id,您可以通过 xpath 获取它:
print doc.xpath('//table[@id="you id"]')[0]
我想你可能想要的是...
doc.xpath('//table[@class="class1"]')[1]