5

我对使用游标类的 tweepy 和分页相当陌生。我一直在尝试使用游标类来获取特定 twitter 用户的所有关注者,但我不断收到错误消息"tweepy.error.TweepError: This method does not perform pagination" 因此,如果有人可以帮助我完成获得所有关注者的任务,我将不胜感激具有分页功能的特定 Twitter 用户,使用 tweepy。我到目前为止的代码如下:

import tweepy

consumer_key='xyz'
consumer_secret='xyz'

access_token='abc'
access_token_secret='def'

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)

auth.set_access_token(access_token, access_token_secret)

api = tweepy.API(auth)


user = api.get_user('somehandle')
print user.name

followers = tweepy.Cursor(user.followers)
temp=[]
for user in followers.items():
    temp.append(user)
    print temp
#the following part works fine but that is without pagination so I will be able to retrieve at #most 100 followers
aDict =  user.followers()
for friend in aDict:
    friendDict = friend.__getstate__()
    print friendDict['screen_name']
4

1 回答 1

6

有一个方便的方法叫做followers_ids. 它为给定的(或,或)返回多达 5000 个关注者(twitter api 限制)ID 。screen_nameiduser_idcursor

然后,您可以在 python 中手动对这些结果进行分页并调用lookup_users每个块。只要lookup_users一次只能处理 100 个用户 ID(twitter api 限制),将块大小设置为 100 是非常合乎逻辑的。

这是代码(分页部分取自此处):

import itertools
import tweepy


def paginate(iterable, page_size):
    while True:
        i1, i2 = itertools.tee(iterable)
        iterable, page = (itertools.islice(i1, page_size, None),
                list(itertools.islice(i2, page_size)))
        if len(page) == 0:
            break
        yield page


auth = tweepy.OAuthHandler(<consumer_key>, <consumer_secret>)
auth.set_access_token(<key>, <secret>)

api = tweepy.API(auth)

followers = api.followers_ids(screen_name='gvanrossum')

for page in paginate(followers, 100):
    results = api.lookup_users(user_ids=page)
    for result in results:
        print result.screen_name

希望有帮助。

于 2013-05-04T21:47:45.710 回答