我想获得从网站上的查看器看到的图像尺寸。
我正在使用漂亮的汤,我得到这样的图片链接:
links = soup.findAll('img', {"src":True})
我获得图像尺寸的方法是使用:
link.has_key('height')
height = link['height']
宽度也是如此。但是,某些链接仅具有这些属性之一。我尝试了 PIL,但如果下载,它会给出实际的图像大小。
有没有其他方法可以找到网站上看到的图像尺寸?
我想获得从网站上的查看器看到的图像尺寸。
我正在使用漂亮的汤,我得到这样的图片链接:
links = soup.findAll('img', {"src":True})
我获得图像尺寸的方法是使用:
link.has_key('height')
height = link['height']
宽度也是如此。但是,某些链接仅具有这些属性之一。我尝试了 PIL,但如果下载,它会给出实际的图像大小。
有没有其他方法可以找到网站上看到的图像尺寸?
您的主要问题是您正在搜索 html 源以获取对高度和宽度的引用。在大多数情况下(当事情做得很好时),图像没有在 html 中指定的高度和宽度,在这种情况下,它们会以图像文件本身的高度和宽度呈现。
要获取图像文件的高度和宽度,您需要实际查询并加载该文件,然后使用图像处理检查高度和宽度。如果这是您想要的,请告诉我,我会帮助您完成该过程。
import urllib, cStringIO
from PIL import Image
# given an object called 'link'
SITE_URL = "http://www.targetsite.com"
URL = SITE_URL + link['src']
# Here's a sample url that works for demo purposes
# URL = "http://therealtomrose.therealrosefamily.com/wp-content/uploads/2012/08/headshot_tight.png"
file = cStringIO.StringIO(urllib.urlopen(URL).read())
im=Image.open(file)
width, height = im.size
if link.has_key('height'):
height = link['height'] # set height if site modifies it
if link.has_key('width'):
width = link['width'] # set width if site modifies it
要求: 此方法需要 PIL 库进行图像处理。
# from command line in a virtual environment
pip install PIL