2

我对 API、ssl 证书等不是很熟悉,但我想访问 facebook 页面的底层 html 代码。我在 Facebook 中使用 getURL() 时遇到问题,并且“ssl.verifypeer = F”不起作用。这是一个例子:

library(RCurl)
txt<-getURL("https://www.facebook.com/nytimes/", ssl.verifypeer = FALSE)

这只返回空字符串:

txt = ""

这是否意味着我需要使用 Graph API?您可以使用 Graph API 访问底层 HTML 代码吗?使用 Firefox 的 Firebug 扩展,我可以看到 html 代码,但我无法通过 R 访问它。我对喜欢或帖子等特定数据不感兴趣,只对 html 代码感兴趣。关于如何访问 facebook 页面的 html 代码的任何建议?提前致谢。

4

1 回答 1

1

利用:

txt <- getURLContent("https://www.facebook.com/nytimes/", ssl.verifypeer = FALSE, followlocation = TRUE)

getURL也可以与followlocation = TRUE. 它适用于我的 linux 机器,但不适用于 Windows 机器。

于 2013-08-10T20:03:22.647 回答