3

我目前正在使用 R 中的 streamR 包从 twitter 中的过滤器流中流式传输推文。我有一个用于此的握手 ROAuth 对象。我的一段代码如下所示:

# load the Twitter auth object
load("twitter_oAuth3.RData")
load("keywords3.RData")

streamTweet = function(){
  require(streamR)
  require(ROAuth)

  stack = filterStream(file.name="",track=keywords,timeout=500,oauth=twitter_oAuth)
  return(stack)
}

我想创建一个实时应用程序,其中包括将这些推文转储到一个 activeMQ 主题中。我的代码是:

require(Rjms)

# Set logger properties
url = "tcp://localhost:61616"
type = "T"
name = "TwitterStream"

# initialize logger
topicWriter = initialize.logger(url,type,name)

topicWrite = function(input){
#   print("writing to topic")
  to.logger(topicWriter,input,asString=TRUE,propertyName='StreamerID',propertyValue='1')
  return()
}

logToTopic = function(streamedStack){ 
#   print("inside stack-writer")
  stacklength = length(streamedStack)
  print(c("Length: ",stacklength))
  for(i in 1:stacklength){
    print(c("calling for: ",i))
    topicWrite(streamedStack[i])
    }
  return()
}

现在我的问题是filterStream()需要的超时。我查看了引擎盖,发现该函数进行了以下调用:

url <- "https://stream.twitter.com/1.1/statuses/filter.json"
    output <- tryCatch(oauth$OAuthRequest(URL = url, params = params, 
                                          method = "POST", customHeader = NULL, 
                                          writefunction = topicWrite, cainfo = system.file("CurlSSL", 
                                                                                             "cacert.pem", package = "RCurl")), error = function(e) e)

我尝试删除超时组件,但它似乎不起作用。有没有一种方法可以永远维持一个流(直到我杀死它),当它进入一个主题时,它会转储每条推文?

PS 我知道一个调用 twitter4j API 的 java 实现。但是,我不知道如何在 R 中做到这一点。

4

1 回答 1

0

包的文档streamR提到超时选项的默认选项filterStream()是 0 ,这将保持连接永久打开。

我引用:

"numeric,连接到流的最大时间长度(秒)。超过此时间后连接将自动关闭。例如,将超时设置为 10800 将保持连接打开 3 小时。默认为 0,将保持连接永久打开。”

希望这可以帮助。

于 2014-09-23T04:54:58.670 回答