我有一个像这样的链接,我想从中提取数据RCurl
,在此之前有一个免责声明页面,我需要在浏览器中单击它才能评估数据。以前我使用下面的脚本(来自这里)来“绕过”免责声明页面并使用以下方式访问数据RCurl
:
pagesource <- getURL(url,.opts=curlOptions(followlocation=TRUE,cookiefile="nosuchfile"))
doc <- htmlParse(pagesource)
以前可以用,最近几天就不行了。实际上我对它在做什么的代码不太了解,我想知道我是否必须更改 . 中的某些内容curlOptions
,或者重新编写整段代码?
谢谢。