我目前正在使用 R 中的 streamR 包从 twitter 中的过滤器流中流式传输推文。我有一个用于此的握手 ROAuth 对象。我的一段代码如下所示:
# load the Twitter auth object
load("twitter_oAuth3.RData")
load("keywords3.RData")
streamTweet = function(){
require(streamR)
require(ROAuth)
stack = filterStream(file.name="",track=keywords,timeout=500,oauth=twitter_oAuth)
return(stack)
}
我想创建一个实时应用程序,其中包括将这些推文转储到一个 activeMQ 主题中。我的代码是:
require(Rjms)
# Set logger properties
url = "tcp://localhost:61616"
type = "T"
name = "TwitterStream"
# initialize logger
topicWriter = initialize.logger(url,type,name)
topicWrite = function(input){
# print("writing to topic")
to.logger(topicWriter,input,asString=TRUE,propertyName='StreamerID',propertyValue='1')
return()
}
logToTopic = function(streamedStack){
# print("inside stack-writer")
stacklength = length(streamedStack)
print(c("Length: ",stacklength))
for(i in 1:stacklength){
print(c("calling for: ",i))
topicWrite(streamedStack[i])
}
return()
}
现在我的问题是filterStream()
需要的超时。我查看了引擎盖,发现该函数进行了以下调用:
url <- "https://stream.twitter.com/1.1/statuses/filter.json"
output <- tryCatch(oauth$OAuthRequest(URL = url, params = params,
method = "POST", customHeader = NULL,
writefunction = topicWrite, cainfo = system.file("CurlSSL",
"cacert.pem", package = "RCurl")), error = function(e) e)
我尝试删除超时组件,但它似乎不起作用。有没有一种方法可以永远维持一个流(直到我杀死它),当它进入一个主题时,它会转储每条推文?
PS 我知道一个调用 twitter4j API 的 java 实现。但是,我不知道如何在 R 中做到这一点。