从 searchTwitter 输出中删除重复项工作正常,问题是 searchTwitter() 函数提供的原始推文数量始终为 100,无论 n=1000 或 n=3000。
这是我使用的代码:
tweets <- searchTwitter("#rstats", n = 1000)
tweets.df <- do.call("rbind", lapply(tweets, as.data.frame))
df.undup <- tweets.df[duplicated(tweets.df) == FALSE,]
dim(df.undup)
结果数据框总是有 100 行,这意味着原始推文的数量是 100。
dim(df.undup)
tweets [1] 100 12
我的问题是:这是否与 twitter API 有关,我该如何解决这个问题。
我在 Mac OS X 10.7.5 上使用 R 版本 2.15.3。