2

我想获得从网站上的查看器看到的图像尺寸。

我正在使用漂亮的汤,我得到这样的图片链接:

links = soup.findAll('img', {"src":True})

我获得图像尺寸的方法是使用:

link.has_key('height')
height = link['height']

宽度也是如此。但是,某些链接仅具有这些属性之一。我尝试了 PIL,但如果下载,它会给出实际的图像大小。

有没有其他方法可以找到网站上看到的图像尺寸?

4

1 回答 1

14

您的主要问题是您正在搜索 html 源以获取对高度和宽度的引用。在大多数情况下(当事情做得很好时),图像没有在 html 中指定的高度和宽度,在这种情况下,它们会以图像文件本身的高度和宽度呈现。

要获取图像文件的高度和宽度,您需要实际查询并加载该文件,然后使用图像处理检查高度和宽度。如果这是您想要的,请告诉我,我会帮助您完成该过程。

import urllib, cStringIO
from PIL import Image

# given an object called 'link'

SITE_URL = "http://www.targetsite.com"
URL = SITE_URL + link['src']
# Here's a sample url that works for demo purposes
# URL = "http://therealtomrose.therealrosefamily.com/wp-content/uploads/2012/08/headshot_tight.png"
file = cStringIO.StringIO(urllib.urlopen(URL).read())
im=Image.open(file)
width, height = im.size
if link.has_key('height'):
    height = link['height']  # set height if site modifies it
if link.has_key('width'):
    width = link['width']  # set width if site modifies it

要求: 此方法需要 PIL 库进行图像处理。

# from command line in a virtual environment
pip install PIL
于 2013-07-25T17:51:21.670 回答