5

所以我使用 selenium 抓取链接。我可以用我的循环打印我的链接,但我无法导航到它们,因为我收到以下错误:

selenium.common.exceptions.StaleElementReferenceException:消息:元素引用已过时;要么元素不再附加到 DOM,它不在当前框架上下文中,要么文档已被刷新

from selenium import webdriver

driver = webdriver.Firefox()

driver.get("https://www.famousgraphicdesigners.org/")

links = driver.find_elements_by_xpath('//*[@id="pages-2"]/div/ul/li/a')
links_total = len(links)
print("Found", links_total, "total links.\n")

for i in links:
    # print(i.get_attribute('href')) # This works
    driver.get(i.get_attribute('href')) # This doesnt work

driver.quit()
4

3 回答 3

8

当您导航到新页面时,先前定位的元素会变得陈旧,在这种情况下,是 中的元素links,因此您无法访问该href属性。将所有的hrefs 保存在字符串列表中并对其进行迭代

links = driver.find_elements_by_xpath('//*[@id="pages-2"]/div/ul/li/a')
links_hrefs = [link.get_attribute('href') for link in links]

for i in links_hrefs:
    driver.get(i)
于 2019-11-24T09:06:10.450 回答
1

在调用相同的元素之前,我遇到了同样的问题和“browser.refresh()”解决了我的问题。

于 2021-11-18T08:15:12.773 回答
0

原因是您所引用的元素已从 DOM 结构中删除。

解决方案

from selenium.webdriver.common.by import By
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.common.action_chains import ActionChains

links = []
driver = webdriver.Chrome(executable_path=r"C:\New folder\chromedriver.exe")
driver.maximize_window()
driver.get('https://www.famousgraphicdesigners.org/')

all_Links = WebDriverWait(driver, 15).until(EC.presence_of_all_elements_located((By.XPATH, "//*[@id='pages-2']/div/ul/li/a[@href]")))

for link in all_Links:
    print link.get_attribute("href")
    links.append(link.get_attribute("href"))

for link in links:
    driver.get(link)
于 2019-11-24T10:20:00.683 回答