我正在使用流式传输 API 来跟踪特定的用户 ID,并且可以毫无问题地进行流式传输。但是,当我将一天内收集的所有流式推文与使用其余 API 收集的推文进行比较时,流式 API 似乎错过了一些转发,即其他人转发的来自用户 ID 的推文。
由于内容被删除,我预计来自其他 API 的推文会丢失,但我不明白为什么流媒体中会丢失推文。
我检查了一下,我没有达到速率限制(全天收集的所有推文都少于 200 条),连接没有中断,我尝试了不同的日子,总是有大约 25% 的推文丢失。没有其他类型的推文丢失。
任何帮助深表感谢!!
class StreamListener(tweepy.StreamListener):
def __init__(self, output_file=sys.stdout):
super(StreamListener,self).__init__()
def on_status(self, status):
with open('tweets.json', 'a') as tf:
json.dump(status._json, tf)
tf.write('\n')
print(status.text)
def on_error(self, status_code):
if status_code == 420:
return False
stream_listener = StreamListener()
stream = tweepy.Stream(auth=api.auth, listener=stream_listener)
stream.filter(follow=<id>)