我编写了一个 Ruby 脚本来抓取SFMOMA 艺术品页面并下载艺术品 .jpgs。我已经设法在底部下载了 .jpg 缩略图,但我更喜欢下载高分辨率的中心图像。不幸的是,HTML 源代码没有显示任何我可以下载的 .jpg 文件。我怀疑Seadragon是原因。
我发现的 closet .jpg 近似值是 og:image .jpg,但它被大量裁剪并且无法使用。
示例: https ://www.sfmoma.org/artwork/91.412
<meta property="og:image" content="https://s3-us-west-2.amazonaws.com/sfmomamedia/media/t/collection_images/6OhBqTH57yLc.jpg">
Seadragon 的大部分渲染似乎都发生在这里。它似乎是在动态创建图像?
<script type="text/javascript">
var viewer;
$(document).ready(function(){
sfmoma.artwork();
viewer = OpenSeadragon({
id: "zoom_image",
springStiffness: 10.5,
gestureSettingsMouse:{
scrollToZoom: false
},
zoomInButton: "zoom-in",
zoomOutButton: "zoom-out",
homeButton: "zoom-home",
prefixUrl: "https://s3-us-west-2.amazonaws.com/sfmomamedia/static/sfmoma/js/openseadragon/built-openseadragon/openseadragon/images/",
visibilityRatio: 0.95,
constrainDuringPan: true,
tileSources: "https://s3-us-west-2.amazonaws.com/sfmomamedia/media/zoom_tiles/72598/image.dzi"
});
});
</script>
我应该如何下载中心件图像?告诉爬虫右键另存为?