0

我有一些基本的 selenium 代码和一个执行良好的 xpath 表达式。

xpath:

/html/body/div/div/table[2]/tbody/tr/td/div/table/tbody/tr//td/div[5]/table/tbody/tr[2]

选择我感兴趣的部分,包含许多

元素。

但是,像这样附加'//p':

/html/body/div/div/table[2]/tbody/tr/td/div/table/tbody/tr//td/div[5]/table/tbody/tr[2]//p

不只选择那些

元素。相反,我最终得到的是一个元素。

我显然缺少一些基本的东西。这是我的代码的示例:

#!/usr/bin/env python

from selenium import webdriver
from time import sleep


fp = webdriver.FirefoxProfile()

wd = webdriver.Firefox(firefox_profile=fp)

wd.get("http://someurl.html")


# appending //p here is the problem that finds only a single <a> element
elems = wd.find_element_by_xpath("/html/body/div/div/table[2]/tbody/tr/td/div/table/tbody/tr/td/div[5]/table/tbody/tr[2]//p")

print elems.get_attribute("innerHTML").encode("utf-8", 'ignore')

wd.close()

编辑:按照建议使用 find_element* s *_by_xpath 而不是 find_element 来解决(感谢 Alexander Petrovich 发现这一点)。

4

1 回答 1

1
  1. 不要使用这样的定位器。把它们缩短一点。就像是//table[@attr='value']/tbody/tr[2]//p
  2. 要选择多个元素,请使用find_elements_by_xpath()方法(它返回 WebElement 对象的列表)
  3. 您将无法使用elems.get_attribute(). 相反,您必须遍历列表

    elems = wd.find_elements_by_xpath("/your/xpath")
    for el in elems:
        print '\n' + el.get_attribute('innerHTML').encode("utf-8", 'ignore')
    
于 2013-09-20T07:36:28.030 回答