0

我正在尝试使用 twitteR 包版本 twitteR_1.1.8 抓取推文,我想通过使用 maxID 来执行此操作。甚至 maxID 属性也在 2 月 11 日发布的 twitteR 手册中;我收到 maxID 无法识别的警告。让我用一个例子来解释我自己:

> t <- searchTwitter('#sample',n=10)
> sapply(t,function(x) x$getId())

 [1] "567760958798700545" "567760485538615296" "567760474096168961"
 [4] "567759761916325888" "567757164480299009" "567752193219235840"
 [7] "567751648655982594" "567750943216001024" "567747456667254784"
 [10] "567745734087172096"
> t1 <- searchTwitter('#sample',n=5,maxID='567757164480299009')

Warning messages:
1: In mapCurlOptNames(names(.els), asNames = TRUE) :
  Unrecognized CURL options: maxid
2: In mapCurlOptNames(names(.els), asNames = TRUE) :
  Unrecognized CURL options: maxid
> sapply(t1,function(x) x$getId())
[1] "567760958798700545" "567760485538615296" "567760474096168961"
[4] "567759761916325888" "567757164480299009"

如您所见,我不能简单地在代码中使用 maxID。R 版本 3.1.2 和 twitteR 版本 twitteR_1.1.8。问题可能是什么?提前致谢..

4

2 回答 2

0

twitteR您的代码使用1.1.8非常适合我。你得到的错误不是来自twitteR,它来自RCurl包。该软件包最近经历了一些修订,其中一个在我的系统上导致任何https://请求失败。所以,我认为这是你的主要嫌疑人。另一个潜在的嫌疑人是httr包裹。

作为参考,我正在使用RCurl_1.95-4.5and httr_0.6.1

于 2015-02-17T20:13:47.413 回答
-1

我遇到了同样的问题 - 尽管将 max(id) 作为 sinceID 我收到了重复的推文!

这是代码:

my_tweets = searchTwitter(as.character(v_search[,i]), lang=NULL, n=10, sinceID = arr_since_id[i])
    v_max_id <- max(my_tweets$id)
    arr_since_id[i] <- v_max_id

packageVersion("RCurl") [1] '1.95.4.5'</p>

packageVersion("twitteR") [1] '1.1.8'</p>

packageVersion("httr") [1] '0.6.1'</p>

于 2015-04-24T19:57:11.557 回答