我正在尝试从http://www.rsssf.com/tablese/eng2014.html中提取一些数据,例如联赛排名以及每轮 R 的得分。
我知道我正在尝试使用 XML,可以使用 RCurl 包,但我不完全确定这样做的方法。
参考这个: Scraping html tables into R data frames using the XML package
library(XML)
theurl <- "http://en.wikipedia.org/wiki/Brazil_national_football_team"
tables <- readHTMLTable(theurl)
n.rows <- unlist(lapply(tables, function(t) dim(t)[1]))
the picked table is the longest one on the page
tables[[which.max(n.rows)]]
我仍然无法在网站上获得表格。如果有人可以帮助我,我真的很感激。谢谢!