2

我正在使用 selenium 从谷歌图像中自动下载几张图像,因为我之前在互联网上找到的所有其他解决方案都太慢或不起作用,但现在我需要提取图像的来源,但是当我尝试使用 element.get_attribute('src') 它返回图像的base64,甚至当我在chrome devtools上搜索xpath时,标签的src属性实际上是一个url

这是 devtools 中元素的屏幕截图

代码试验:

        for i in range(n):
            element = self.wait.until(
                EC.presence_of_element_located((By.XPATH, '//*[@id="Sva75c"]/div/div/div[3]/div[2]/c-wiz/div/div[1]/div[1]/div[2]/div/a/img')))
            src = element.get_attribute('src')
            print(element)
            self.download_file(src,keyword)

编辑:

我实际上尝试了你们中的一些人所说的,而不是下载图像,而是将 base 64 转换为图像并保存,这比使用请求和 URL 保存要快得多,但我猜这更多是谷歌脚本的问题与我的代码相比,有时我的代码会损坏,因为 src 实际上返回了一个 URL,最后,我必须创建两个不同的函数,一个是 src 返回一个 url,另一个是返回 base64

4

2 回答 2

0

要打印src属性的值,您需要诱导WebDriverWait并且visibility_of_element_located()您可以使用以下任一Locator Strategies

  • 使用CSS_SELECTOR

    print(WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.CSS_SELECTOR, "img[alt='Letter A AC - Decortiles'][src]"))).get_attribute("src"))
    
  • 使用XPATH

    print(WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, "//img[@alt='Letter A AC - Decortiles' and @src]"))).get_attribute("src"))
    
  • 注意:您必须添加以下导入:

    from selenium.webdriver.support.ui import WebDriverWait
    from selenium.webdriver.common.by import By
    from selenium.webdriver.support import expected_conditions as EC
    
于 2021-11-05T08:59:31.737 回答
0

我可以使用以下代码从另一个搜索引擎DuckDuckGo检索实际图像 URL :

search_query = 'what you want to find'
num_images = 1
driver_location = '/put/location/of/your/driver/here'

ser = Service(driver_location)
op = webdriver.ChromeOptions()
driver = webdriver.Chrome(service=ser, options=op)

# searching the query
driver.get(f'https://duckduckgo.com/?q={search_query}&kl=us-en&ia=web')

# going to Images Section
ba = driver.find_element(By.XPATH, "//a[@class='zcm__link  js-zci-link  js-zci-link--images']")
ba.click()

# getting the images URLs
for result in driver.find_elements(By.CSS_SELECTOR, '.js-images-link')[0:0+num_images]:
    imageURL = result.get_attribute('data-id')

    print(f'{imageURL}\n')

driver.quit()
于 2021-12-21T15:14:40.697 回答