Twitter 在 API 上返回搜索结果时,每个“页面”仅返回 100 条推文。它们在返回值中提供max_id
和,可用作参数来获取较早/较晚的推文。since_id
search_metadata
Twython 3.1.2 文档表明这种模式是搜索的“旧方式”:
results = twitter.search(q="xbox",count=423,max_id=421482533256044543)
for tweet in results['statuses']:
... do something
这就是“新方式”:
results = twitter.cursor(t.search,q='xbox',count=375)
for tweet in results:
... do something
当我做后者时,它似乎在无休止地迭代相同的搜索结果。我正在尝试将它们推送到 CSV 文件,但它会推送大量重复项。
使用 Twython 搜索大量推文并遍历一组独特结果的正确方法是什么?
编辑:这里的另一个问题是,当我尝试使用生成器 ( for tweet in results:
) 进行迭代时,它会反复循环,而不会停止。啊 - 这是一个错误...... https://github.com/ryanmcgrath/twython/issues/300