我想制作一张真实世界总统的地图。
为此,我想从维基百科中抓取每位总统的图像。
第一步是从 wiki 页面获取数据: http ://en.wikipedia.org/wiki/List_of_current_heads_of_state_and_government
我无法获取国家/地区名称和总统页面网址,因为该表具有行跨度。
目前,我的代码如下所示,但由于行跨越,所以不行。
library(XML)
u = "http://en.wikipedia.org/wiki/List_of_current_heads_of_state_and_government"
doc = htmlParse(u)
tb = getNodeSet(doc, "//table")[[3]]
stateNames <- readHTMLTable(tb)$State
presidentUrls <- xpathSApply(tb, "//table/tr/td[2]/a[2]/@href")
欢迎任何想法!
垫