我正在尝试找到一种使用主题标签来抓取 Tweeter 数据的简单方法。例如,我希望能够抓取所有包含#testhash 的推文。
我看过几篇文章,尤其是一篇(http://www.datablog.sytpp.net/2014/04/scraping-twitter-with-ra-how-to/),但似乎 tweetR 包已损坏(不安装在我的电脑上并使 R 崩溃)。任何想法都会很棒,但我特别熟悉 R,所以会更好。
我正在尝试找到一种使用主题标签来抓取 Tweeter 数据的简单方法。例如,我希望能够抓取所有包含#testhash 的推文。
我看过几篇文章,尤其是一篇(http://www.datablog.sytpp.net/2014/04/scraping-twitter-with-ra-how-to/),但似乎 tweetR 包已损坏(不安装在我的电脑上并使 R 崩溃)。任何想法都会很棒,但我特别熟悉 R,所以会更好。
2015 年 4 月,您提到的博客文章中的代码不再适用于我(使用 twitteR v1.1.8)。
而且我不知道你为什么没有成功安装 twitteR 包。尝试自己一个一个地安装依赖项。对于每个:
方法、bit64、rjson、DBI、httr、twitteR
跑
install.packages("methods")
#...
也许这有助于找出问题所在。
然后我只是尝试了这个(快速而肮脏的解决方案。不要与任何人共享您的明文凭据):
library(twitteR)
#, please see https://apps.twitter.com/
consumerKey = "PH...." # from your app name
consumerSecret = "zr...."
accessToken = "5199999-22...."
accessSecret = "94..."
options(httr_oauth_cache=TRUE) # skip question appearing on console
setup_twitter_oauth(consumer_key = consumerKey, consumer_secret = consumerSecret,
access_token = accessToken, access_secret = accessSecret)
# tweets about beer
searchTwitter("#beer", n=100)
# tweets about Berlin
searchTwitter("#berlin", n=100)
# tweets about nerds
searchTwitter("#nerds", n=100)
# tweets about R
#Rtweets(n=42)
# ...
##########################################################################
## lets test out what our session limits look like now after these requests
##########################################################################
rate.limit <- getCurRateLimitInfo()
# print out all metrics that have been changed
rate.limit[rate.limit$limit != rate.limit$remaining,]