主要问题:Twitter 的速率限制是否允许我进行必要的数据挖掘,以在大约 60 万用户之间构建一个包含所有有向边的完整社交网络图?
这是想法:
网络中的边/联系/关系将是追随者/被追随关系。
从大约 600 名 Twitter 用户的特定列表开始,选择这些用户是因为他们都来自一个大城市的所有新闻媒体。
收集所有 600 个用户的所有关注者和朋友(他们关注的人)。这些用户的平均关注者人数可能为每人 2,000 人。他们可能有平均 500 个朋友(他们关注的人)。
由于这 600 人的这些追随者都在同一个城市,因此预计这些追随者中的许多人将是关注这 600 人的同一用户。所以让我们粗略估计一下,这 600 个用户总共有大约 600,000 个关注者和朋友。所以这将是一个有 600,600 个 Twitter 用户的子图/网络。
因此,一旦我收集了所有这 600 人的所有 600,000 追随者和朋友,我希望能够构建所有这 600,600 人和他们的追随者的社交网络。这将要求我至少能够在这 600,600 名用户中找到所有有向边(无论这 600,600 名用户中的每一个是否相互关注)。有了 Twitter 速率限制,这种数据挖掘是否可行?