0

我想使用 R 中的 twitteR 包来比较从 2012 年 11 月 14 日到 2012 年 11 月 22 日(即 8 天的时间段)两个竞争主题标签的提及次数(计数)。例如,我想每小时比较两个主题标签:#A 与 #B。

我想知道是否有办法在 R 中使用 twitteR 包来做到这一点。使用 searchTwitter 功能的东西:

searchTwitter(searchString, n=25, lang=NULL, since=NULL, until=NULL,
              locale=NULL, geocode=NULL, sinceID=NULL, ...)

我对抓取所有推文不感兴趣,只是在指定时间段内获取#A 与 #B 的每小时计数比较。我知道我必须了解速率限制,并且可能必须对推文进行一些巧妙的采样以避免速率限制。如果这是可行的任何想法,以及我将如何进行编码?

4

1 回答 1

1

我会每 2 分钟为每个标签提取 100 条推文。使用 #TweetsReturned / (TimePulled - TimeOfOldestTweet) 获得每单位时间的推文估计。您可以绘制这些图表以获得随时间变化的移动平均类型图表。如果您每 2 分钟发布推文,只需将它们相加即可估算每小时的推文。

于 2012-12-08T14:39:45.567 回答