3

我需要为我的研究收集推文的“集合”,即推特对话;

集合还需要满足以下条件

  • 其中的推文数量,以及
  • 参与人数。

我查看了 Twitter Streaming API、twitter-stream gem,但我发现它们都不适合我的目的。

有没有什么简单的方法可以实现这个目标?

4

2 回答 2

3

你的出发点是什么?你将如何判断一条推文是否符合你的标准?

一旦你这样做了,它就相当简单了。

  • 获取作为对话起点的推文。
  • 搜索对该推文的回复。
    • Twitter 不会让你搜索“in_reply_to”,但你可以搜索提到“@user”的每个人并按“in_reply_to”过滤
  • 递归地重复。

您最终会得到一棵以起始推文作为根节点的树。您应该能够遍历树以查看有多少唯一用户以及有多少推文。

于 2012-12-17T09:16:01.830 回答
0

看起来你和我有同样的目的,我已经为它制作了一些 python 代码。 https://github.com/song9446/twitter-corpus-crawler-python

用法:

from tccp import search_conversation
# fetch 10 conversations in english
for conversation in search_conversation({"l": "en"}, 10): 
    for tweet in conversation:
        print(tweet["author"] + ": " + tweet["contents"])

虽然这是一个旧线程,但我希望这对某人有所帮助。

于 2017-08-02T10:17:26.957 回答