我有一个用 Python 编写的文件,它发送到 Twitterstream 并根据列表中的关键字获取消息。列表很长,输出不是我想要的。我想清理文件并将结果输出到文本文件。
这是我当前的代码,它将所有消息写入一行:
import sys
....
if __name__ == '__main__':
with open("keywords.txt", "r") as f:
keywords = f.readlines()
l = StdOutListener()
auth = OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
stream = Stream(auth, l)
stream.filter(track=keywords])
上面没有引入任何内容,这意味着当我在命令提示符下键入以下内容时,没有任何内容输出到文本文件中。python hashtagworking.py > output.txt
其中大约有 300 项,stream.filter
所以我想使用 txt 文件代替实际文本。此外,每条消息的结果都显示在一行上,这是它的编写方式,我想将其重写为消息中每个对象的输出到 csv 文件。
我认为这是我正在寻找的,但想确保:类似的问题
我还想从其他嵌套对象(例如实体:{...})中获取内容,特别是我想从实体对象中获取主题标签,更具体地说是任何对象。我已经尝试过一切data.text.hashtag
data.entities.hashtag
data.entities.media.hashtag
都无济于事。