我想从公共 Instagram 帐户中抓取图片。我对bs4非常熟悉,所以我从那个开始。使用 Chrome 上的元素检查器,我注意到图片在一个无序列表中,并且 li 有类“照片”,所以我想,到底是什么——用 findAll 很难刮,对吧?
错误:它没有返回任何东西(下面的代码),我很快注意到元素检查器中显示的代码和我从请求中提取的代码不是相同的,也就是我从请求中提取的代码中没有无序列表。
知道如何获得元素检查器中显示的代码吗?
只是为了记录,这是我开始的代码,它不起作用,因为无序列表不存在:
from bs4 import BeautifulSoup
import requests
import re
r = requests.get('http://instagram.com/umnpics/')
soup = BeautifulSoup(r.text)
for x in soup.findAll('li', {'class':'photo'}):
print x
谢谢您的帮助。