1

我是编程新手,但我希望你能帮助我解决我的问题。我正在尝试使用 tweepy/python/stream.api 和 R(统计程序)分析推文。

知道流监听器正在工作,但我不能使用输出......

这是我正在运行的脚本:

import tweepy

consumer_key="..."
consumer_secret="..."
access_key = "..."
access_secret = "..."


auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_key, access_secret)
api = tweepy.API(auth)

class CustomStreamListener(tweepy.StreamListener):
    def on_status(self, status):
        print status.text

    def on_error(self, status_code):
        print >> sys.stderr, 'Encountered error with status code:', status_code
        return True # Don't kill the stream

    def on_timeout(self):
        print >> sys.stderr, 'Timeout...'
        return True # Don't kill the stream

sapi = tweepy.streaming.Stream(auth, CustomStreamListener())
sapi.filter(track=['...'])

结果,我没有得到完整的推文(只有前 50 个字符),而且我看不到推文的发布时间。我该如何解决这个问题,是否可以以某种方式将输出“打印”到 Excel 文件中?

4

2 回答 2

0

更改您print status.text以使用 xlwt 直接写入 Excel 工作表中的单元格。我已经破解了它并且没关系,但是您的代码往往会变得非常冗长。

http://pypi.python.org/pypi/xlwt

于 2012-11-22T11:35:00.617 回答
0

将输出写入 .csv 文件或使用 xlrd 包。至于50个字符,我不知道。看起来这与图书馆有关。

于 2012-10-21T23:27:23.740 回答