0

首先,我想知道一般情况下如何实现这一点,然后也许有人知道如何使用 Capybara 来实现这一点。

示例:<img src="http://example.com/getrandomimage"> 事情是src指向返回随机图像的脚本,而不是图像本身。页面加载,脚本运行,图像显示。我可以很容易地得到这个src值,但是如果我访问下载图像的链接,脚本会再次运行并返回一张完全不同的图片。我需要已经在页面上的那个。

4

1 回答 1

0

我认为使用 JS 或 Capybara 的过程会非常相似。我将其分为两个步骤:

  1. 编写一个可以找到<img>标签的选择器。在 JS 中可能看起来像:

    myImg = document.getElementByTagName("img")
    
  2. 调用.src返回的节点:

    result = myImg.src
    

我相信 Capybara 仅限于 XPath 和 CSS 选择器。因此,根据您尝试抓取的页面,您必须在 HTML 标记或 CSS 属性中识别某种模式才能找到该<img>标记。

于 2013-08-01T02:38:45.277 回答