我正在尝试在 R 中创建一个映射,该映射既传达底层几何图形的形状(即物理边界),又传达对象在关联值方面的相对重要性。
具体而言,我想专注于复制(一个版本)以下地图*(形状,而不是颜色,因为我找不到轮询数据):
我也不想费心让阿拉斯加和夏威夷出现在美国下方,而不是它们的测地线正确位置。
我只是将数据与权重合并,例如如下所示:
1.获取多边形
library(maptools)
library(data.table) #not strictly necessary but I prefer it
#US states downloaded (500k resolution) from:
#https://www.census.gov/geo/maps-data/data/cbf/cbf_state.html
us.states<-
readShapePoly("~/Desktop/cb_2014_us_state_5m.shp")
setDT(us.states@data)
#for getting rid of territories, AK, HI
states<-sprintf("%02d",1:59)
ak.hi<-c("02","15")
us.states.contig<-
us.states[us.states@data$STATEFP %in%
setdiff(states,ak.hi),]
#Unadorned plot
plot(us.states.contig)
text(coordinates(us.states.contig),
us.states.contig@data[,paste0(STUSPS)],
cex=.7)
2. 添加选举人团数据
#scraped from government page
library(rvest) #only necessary to scrape table
electoral.college.url<-
paste0("http://www.archives.gov/federal-register/",
"electoral-college/allocation.html")
electoral.college.dt<-
(html(electoral.college.url) %>%
html_nodes("table"))[[5]] %>%
html_table()
setDT(electoral.college.dt)
setnames(electoral.college.dt,c("State","Votes"))
#merge into geodata
us.states.contig@data<-
copy(us.states.contig@data)[
electoral.college.dt,electoral.votes:=i.Votes,
on=c(NAME="State")]
#plot, coloring each state by size
states.ranked<-
us.states.contig@data[,rank(electoral.votes,
ties.method="first")]
cols<-colorRampPalette(c("red","blue"))(51)[states.ranked]
plot(us.states.contig,col=cols)
这一切都很好——看一眼这张地图,我们就可以知道哪些州在选举团中的代表性高低。但是如果(就像在我们的目标地图中)我们想用状态的颜色来表示另一个变量怎么办?
3. 增加 2012 年选举结果
#scrape again
#2012 Election Results by State
election.wiki<-
paste0("https://en.wikipedia.org/wiki/",
"United_States_presidential_election,_2012")
results<-
html(election.wiki) %>%
html_node(xpath='//*[@id="mw-content-text"]/div[22]/table') %>%
html_table()
#eliminate second header row, delete final row,
# keep only the important columns
results.trim<-results[2:(nrow(results)-1),c(1,4,21)]
colnames(results.trim)<-c("name","pct","abbr")
results.dt<-setDT(results.trim)
#data idiosyncrasies, see Wiki page
results.dt<-results.dt[!grepl("–",abbr)|grepl("a",abbr)]
results.dt[grepl("–",abbr),abbr:=gsub("–.*","",abbr)]
results.dt[,"pct":=as.numeric(gsub("%","",pct))]
#merge
us.states.contig@data<-
copy(us.states.contig@data
)[results.dt,vote.pct:=i.pct,
on=c(STUSPS="abbr")]
pcts<-us.states.contig@data[,vote.pct]
cols<-c("red","blue")[(pcts>=50)+1L]
tx.col<-c("white","black")[(cols=="red")+1L]
plot(us.states.contig,col=cols)
text(coordinates(us.states.contig),
us.states.contig@data[,paste0(STUSPS)],
col=tx.col)
最后一张图是问题的症结所在。从我们可以从地图的红色与蓝色百分比中感知共和党还是民主党获胜的意义上,第一个图表要好得多。最后一张地图具有误导性,因为共和党人数最多的州也是人口最稀少的州。
有没有办法创建这张地图的扭曲版本,以传达每个州在选举团中的相对重要性?我在网上找不到任何帮助,可能主要是因为我不知道这种类型的图表是否有标准名称。
*这张地图是在这里找到的;我以前见过类似的尺寸扭曲的地图,例如在The Economist中。它似乎是基于普林斯顿选举联盟的 Sam Wang 博士的工作,由Drew Thaler制作。