我目前无法获取使用 tweepy 访问 Twitter 的 Streaming API 以正确运行的示例代码(错误......或者至少我期望它如何运行)。我正在使用来自 GitHub(标记为 1.9 版)和 Python 2.7.1 的最新克隆 tweepy。
我尝试了来自三个来源的示例代码,在每种情况下都使用“twitter”作为跟踪的测试术语:
O'Rilley Answers 代码:如何使用 Twitter 的 Streaming API 实时捕获推文
Andrew Robinson 的博客:使用 Tweepy 访问 Twitter 流
GitHub 上的 Tweepy 示例存储库(正如 Andrew Robinson 所做的那样,可以轻松修改以支持 OAuth 身份验证):streamwatcher.py
在所有三种情况下,我得到相同的结果:身份验证成功,没有产生错误,并且主程序循环似乎正在执行而没有任何问题。我看到网络使用率跃升至约 200KB/s,python 进程跃升至接近 100% 的 CPU 使用率,所以我认为正在接收数据。然而,没有任何东西输出到控制台。
我怀疑 tweepy 的 Stream 类由于某种原因没有调用自定义回调方法。我尝试重写每个示例中的回调方法,以便在调用它们时产生输出,这似乎证实了这一点。这是基于 Andrew Robinson 的博客条目的一个非常简单的测试代码(当然,我的应用程序的键被删除了):
# -*- coding: utf-8 -*-
import tweepy
consumer_key = ''
consumer_secret = ''
access_token_key = ''
access_token_secret = ''
auth1 = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth1.set_access_token(access_token_key, access_token_secret)
class StreamListener(tweepy.StreamListener):
def on_status(self, tweet):
print 'Ran on_status'
def on_error(self, status_code):
print 'Error: ' + repr(status_code)
return False
def on_data(self, data):
print 'Ok, this is actually running'
l = StreamListener()
streamer = tweepy.Stream(auth=auth1, listener=l)
#setTerms = ['hello', 'goodbye', 'goodnight', 'good morning']
setTerms = ['twitter']
streamer.filter(track = setTerms)
我究竟做错了什么?