5

我正在尝试(在 R 中)从以下位置抓取一些数据:

http://www.soccerbase.com/matches/results.sd?date=2012-11-04

即,我想获取当您按下i按钮时出现在页面上的匹配详细信息。但是,单击按钮后出现的信息不包含在原始 html 代码中。我只能看到一条线(我希望包含数据)......

<span class="infoField"><a href="#" class="info finished" title="Show full match details"></a></span>

...这几乎让我陷入了死胡同...有什么想法吗?

4

1 回答 1

4
require(XML)
require(RCurl)
dataurl<-'http://www.soccerbase.com/matches/results.sd?date=2012-11-04'
sdata<-htmlParse(dataurl)
sid<-xpathSApply(sdata,'//*/tr/@id')
sid<-gsub('^tgc','',sid)
mUrl<-paste0('http://www.soccerbase.com/matches/additional_information.sd?id_game=',sid)

上面的代码将获得附加数据所需的 url。但是,我会与该网站核实是否收集他们的数据。

于 2012-11-06T14:30:06.267 回答