我需要为我的研究收集推文的“集合”,即推特对话;
集合还需要满足以下条件
- 其中的推文数量,以及
- 参与人数。
我查看了 Twitter Streaming API、twitter-stream gem,但我发现它们都不适合我的目的。
有没有什么简单的方法可以实现这个目标?
你的出发点是什么?你将如何判断一条推文是否符合你的标准?
一旦你这样做了,它就相当简单了。
您最终会得到一棵以起始推文作为根节点的树。您应该能够遍历树以查看有多少唯一用户以及有多少推文。
看起来你和我有同样的目的,我已经为它制作了一些 python 代码。 https://github.com/song9446/twitter-corpus-crawler-python
用法:
from tccp import search_conversation
# fetch 10 conversations in english
for conversation in search_conversation({"l": "en"}, 10):
for tweet in conversation:
print(tweet["author"] + ": " + tweet["contents"])
虽然这是一个旧线程,但我希望这对某人有所帮助。