3

我正在使用流式传输 API 来跟踪特定的用户 ID,并且可以毫无问题地进行流式传输。但是,当我将一天内收集的所有流式推文与使用其余 API 收集的推文进行比较时,流式 API 似乎错过了一些转发,即其他人转发的来自用户 ID 的推文。

由于内容被删除,我预计来自其他 API 的推文会丢失,但我不明白为什么流媒体中会丢失推文。

我检查了一下,我没有达到速率限制(全天收集的所有推文都少于 200 条),连接没有中断,我尝试了不同的日子,总是有大约 25% 的推文丢失。没有其他类型的推文丢失。

任何帮助深表感谢!!

class StreamListener(tweepy.StreamListener):

    def __init__(self, output_file=sys.stdout):
        super(StreamListener,self).__init__()

    def on_status(self, status):
        with open('tweets.json', 'a') as tf:

            json.dump(status._json, tf)    

            tf.write('\n')

        print(status.text)

    def on_error(self, status_code):
        if status_code == 420:
            return False


stream_listener = StreamListener()
stream = tweepy.Stream(auth=api.auth, listener=stream_listener)
stream.filter(follow=<id>)
4

0 回答 0