1

我正在尝试在 R 中创建一个映射,该映射既传达底层几何图形的形状(即物理边界),传达对象在关联值方面的相对重要性。

具体而言,我想专注于复制(一个版本)以下地图*(形状,而不是颜色,因为我找不到轮询数据):

一张扭曲的美国地图,标题为

我也不想费心让阿拉斯加和夏威夷出现在美国下方,而不是它们的测地线正确位置。

我只是将数据与权重合并,例如如下所示:

1.获取多边形

library(maptools)
library(data.table) #not strictly necessary but I prefer it
#US states downloaded (500k resolution) from:
#https://www.census.gov/geo/maps-data/data/cbf/cbf_state.html
us.states<-
  readShapePoly("~/Desktop/cb_2014_us_state_5m.shp")

setDT(us.states@data)

#for getting rid of territories, AK, HI
states<-sprintf("%02d",1:59)
ak.hi<-c("02","15")

us.states.contig<-
  us.states[us.states@data$STATEFP %in% 
              setdiff(states,ak.hi),]

#Unadorned plot
plot(us.states.contig)
text(coordinates(us.states.contig),
     us.states.contig@data[,paste0(STUSPS)],
     cex=.7)

美国大陆的平原、未扭曲的地图。 白色多边形,黑色边框,带有两个字母的州邮政编码。

2. 添加选举人团数据

#scraped from government page
library(rvest) #only necessary to scrape table
electoral.college.url<-
  paste0("http://www.archives.gov/federal-register/",
         "electoral-college/allocation.html")

electoral.college.dt<-
  (html(electoral.college.url) %>%
     html_nodes("table"))[[5]] %>% 
  html_table()
setDT(electoral.college.dt)
setnames(electoral.college.dt,c("State","Votes"))

#merge into geodata
us.states.contig@data<-
  copy(us.states.contig@data)[
    electoral.college.dt,electoral.votes:=i.Votes,
    on=c(NAME="State")]

#plot, coloring each state by size
states.ranked<-
  us.states.contig@data[,rank(electoral.votes,
                              ties.method="first")]
cols<-colorRampPalette(c("red","blue"))(51)[states.ranked]

plot(us.states.contig,col=cols)

相同的未扭曲的州地图,但这次,每个州都被涂成红色、蓝色或紫色。 红色的意思

这一切都很好——看一眼这张地图,我们就可以知道哪些州在选举团中的代表性高低。但是如果(就像在我们的目标地图中)我们想用状态的颜色来表示另一个变量怎么办?

3. 增加 2012 年选举结果

#scrape again
#2012 Election Results by State
election.wiki<-
  paste0("https://en.wikipedia.org/wiki/",
         "United_States_presidential_election,_2012")
         
results<-
  html(election.wiki) %>%
  html_node(xpath='//*[@id="mw-content-text"]/div[22]/table') %>%
  html_table()
#eliminate second header row, delete final row,
#  keep only the important columns
results.trim<-results[2:(nrow(results)-1),c(1,4,21)]
colnames(results.trim)<-c("name","pct","abbr")
results.dt<-setDT(results.trim)
#data idiosyncrasies, see Wiki page
results.dt<-results.dt[!grepl("–&quot;,abbr)|grepl("a",abbr)]
results.dt[grepl("–&quot;,abbr),abbr:=gsub("–.*","",abbr)]
results.dt[,"pct":=as.numeric(gsub("%","",pct))]

#merge
us.states.contig@data<-
  copy(us.states.contig@data
       )[results.dt,vote.pct:=i.pct,
         on=c(STUSPS="abbr")]
                              
pcts<-us.states.contig@data[,vote.pct]
cols<-c("red","blue")[(pcts>=50)+1L]
tx.col<-c("white","black")[(cols=="red")+1L]
plot(us.states.contig,col=cols)
text(coordinates(us.states.contig),
     us.states.contig@data[,paste0(STUSPS)],
     col=tx.col)

再次出现未扭曲的状态,这一次根据选举结果完全是红色或蓝色。

最后一张图是问题的症结所在。从我们可以从地图的红色与蓝色百分比中感知共和党还是民主党获胜的意义上,第一个图表要好得多。最后一张地图具有误导性,因为共和党人数最多的州也是人口最稀少的州。

有没有办法创建这张地图的扭曲版本,以传达每个州在选举团中的相对重要性?我在网上找不到任何帮助,可能主要是因为我不知道这种类型的图表是否有标准名称。

*这张地图是在这里找到的;我以前见过类似的尺寸扭曲的地图,例如在The Economist中。它似乎是基于普林斯顿选举联盟的 Sam Wang 博士的工作,由Drew Thaler制作。

4

1 回答 1

3

遵循包维护者@chkaiser 的建议,我寻找并最终发现了一种在 R 中执行此操作的方法。这篇博客文章提供了巨大的帮助,并且getcartr包非常棒。

首先,从 GitHub获取Rcartogram和包:getcartr

remotes::install_github("omegahat/Rcartogram")
remotes::install_github('chrisbrunsdon/getcartr', subdir='getcartr')
library(Rcartogram)
library(getcartr)

现在只需插入和突突:

us.states.contig.carto = quick.carto(
  us.states.contig,
  us.states.contig@data$electoral.votes
)
plot(us.states.contig.carto, col = cols)
text(
  coordinates(us.states.contig.carto),
  us.states.contig@data[ , paste0(STUSPS)],
  col = tx.col
)

就像我们有我们的图表一样:

制图

于 2015-09-06T23:29:51.110 回答