Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
首先,我想知道一般情况下如何实现这一点,然后也许有人知道如何使用 Capybara 来实现这一点。
示例:<img src="http://example.com/getrandomimage"> 事情是src指向返回随机图像的脚本,而不是图像本身。页面加载,脚本运行,图像显示。我可以很容易地得到这个src值,但是如果我访问下载图像的链接,脚本会再次运行并返回一张完全不同的图片。我需要已经在页面上的那个。
<img src="http://example.com/getrandomimage">
src
我认为使用 JS 或 Capybara 的过程会非常相似。我将其分为两个步骤:
编写一个可以找到<img>标签的选择器。在 JS 中可能看起来像:
<img>
myImg = document.getElementByTagName("img")
调用.src返回的节点:
.src
result = myImg.src
我相信 Capybara 仅限于 XPath 和 CSS 选择器。因此,根据您尝试抓取的页面,您必须在 HTML 标记或 CSS 属性中识别某种模式才能找到该<img>标记。