1

我编写了一个 Ruby 脚本来抓取SFMOMA 艺术品页面并下载艺术品 .jpgs。我已经设法在底部下载了 .jpg 缩略图,但我更喜欢下载高分辨率的中心图像。不幸的是,HTML 源代码没有显示任何我可以下载的 .jpg 文件。我怀疑Seadragon是原因。

我发现的 closet .jpg 近似值是 og:image .jpg,但它被大量裁剪并且无法使用。

示例: https ://www.sfmoma.org/artwork/91.412

<meta property="og:image" content="https://s3-us-west-2.amazonaws.com/sfmomamedia/media/t/collection_images/6OhBqTH57yLc.jpg">

Seadragon 的大部分渲染似乎都发生在这里。它似乎是在动态创建图像?

<script type="text/javascript">
    var viewer;
    $(document).ready(function(){
        sfmoma.artwork();

            viewer = OpenSeadragon({
                id: "zoom_image",
                springStiffness: 10.5,
                gestureSettingsMouse:{
                    scrollToZoom: false
                },
                zoomInButton: "zoom-in",
                zoomOutButton: "zoom-out",
                homeButton: "zoom-home",

                prefixUrl: "https://s3-us-west-2.amazonaws.com/sfmomamedia/static/sfmoma/js/openseadragon/built-openseadragon/openseadragon/images/",
                visibilityRatio: 0.95,
                constrainDuringPan: true,
                tileSources: "https://s3-us-west-2.amazonaws.com/sfmomamedia/media/zoom_tiles/72598/image.dzi"
            });

    });
</script>

我应该如何下载中心件图像?告诉爬虫右键另存为?

4

0 回答 0