我希望通过 R 访问我的 Google 网站管理员工具的 API。
我从这里看到:
http://code.google.com/apis/webmastertools/docs/2.0/reference.html
它需要在 https 后面获取提要并对其进行解析。
关于如何做的任何建议?
我希望通过 R 访问我的 Google 网站管理员工具的 API。
我从这里看到:
http://code.google.com/apis/webmastertools/docs/2.0/reference.html
它需要在 https 后面获取提要并对其进行解析。
关于如何做的任何建议?
基于一些谷歌搜索,我会说 RCurl 库是你最好的选择 HTTP 的东西。他们有一个关于如何进行一些基本操作和使用 XML 有效负载的很好的例子:http ://www.omegahat.org/RCurl/xmlParse.html
与其他 GData 服务一样,网站管理员工具 api 是基于 AtomPub 的 XML。使用 XML 库进行解析应该相当容易,但您需要自己编写代码。
Brandon 提到的 Googleanalytics4r 采用了同样的方法。请参阅:https ://github.com/sorenmacbeth/googleanalytics4r/blob/master/R/googleanalytics4r.R
它有点 hacky,但我通过这里的 python 工具(http://code.google.com/p/webmaster-tools-downloads/source/browse/downloader.py)从 R 访问 GWT 数据,通过发出 system()命令,例如
feedback <- system("python ./gwt-tool/googlewebmastertool_download_gmt.py")
其中“反馈”将是从脚本生成的消息,文件出现在系统调用的工作目录中。
更好的解决方案是使用 httr 包来发出请求(这是上面建议的 RCurl 的包装器) - 我发现 httr 可以解决 RCurl 可能出现的一些配置问题。