嗨,我是 python 的初学者,我正在尝试获取一些微博帐户的关注者数量。我尝试使用微博 API,但无法获取微博帐户的信息(不是我的帐户/没有凭据)。据我查到,微博要求用户提交申请以供审核,以获取更多API(包括获取关注者数)
因此,我决定尝试使用网页抓取而不是使用微博 API。但是,我对此并没有太多想法。我知道我可以使用 json 和 requests 之类的库来从网站获取内容。我坚持获取内容
from json import loads
import requests
username_weibo = ['kupono','xxx','etc']
def get_weibo_followers(username):
output = ['Followers']
for user in username:
r = requests.get('https://www.weibo.com/'+user).content
html = r.encode('utf-8')
return r
到目前为止,我试图打印出代码的样子,而我得到的是一堆乱七八糟的单词/字符。此外,有太多的 FM.views(来自页面源)让我感到困惑。
这是我到目前为止所做的,但我不知道如何继续。有人可以帮忙吗?谢谢你。