我想使用 selenium 驱动程序包从各种网页中提取元素。我通过文本识别目标元素,使用find_elements_by_xpath. 虽然我认为我能够解决“空白”、“中断”等问题,但不幸的是,我的代码没有找到以下元素。
这是我试图通过使用其文本找到的元素:
x = """<p align="left"><font face="Arial" color="#439539" size="5">Compensation
Discussion<br>& Analysis</font></p>"""
这是相应网页的原始代码截图。
这是我目前用来识别包含文本“薪酬讨论与分析”的元素的代码:
searchterm = "Compensation Discussion & Analysis
driver.find_elements_by_xpath("//*[contains(normalize-space(translate(., '\u00A0', ' ')), '" + searchterm + "')]")
我知道可能有一些方法可以只包含我的搜索词的一部分,例如starts-with()和类似的。但是,我更愿意继续寻找整个搜索词而不将其拆分为组件。
非常感谢任何帮助!提前非常感谢!




