如何使用 python beautifulsoup 解析以下代码?我需要获取每个图像及其相应的宽度和高度属性(如果它们存在)。
下面的代码“表示此页面上有 3 张图片,第一张图片为 300x300,中间一张的尺寸未指定,最后一张为 1000px 高”(如此处所述)
<meta property="og:image" content="http://example.com/rock.jpg" />
<meta property="og:image:width" content="300" />
<meta property="og:image:height" content="300" />
<meta property="og:image" content="http://example.com/rock2.jpg" />
<meta property="og:image" content="http://example.com/rock3.jpg" />
<meta property="og:image:height" content="1000" />
到目前为止,我有以下代码,但它只返回第一组维度:
images = []
img_list = soup.findAll('meta', {"property":'og:image'})
for og_image in img_list:
if not og_image.get('content'):
continue
image = {'url': og_image['content']}
width = self.soup.find('meta', {"property":'og:image:width'})
if width:
image['width'] = width['content']
height = self.soup.find('meta', {"property":'og:image:height'})
if width:
image['height'] = height['content']
images.append(image)
谢谢!