1

更新: 为了回应关于代码可读性的非常合理的评论,我已经重组了代码块。

我正在尝试绘制科罗拉多州每个地区的人口普查数据,但我遇到了一些我不知道如何解释的事情。(shapefile 可以在这里找到,Summary File 1 数据是通过Census API提取的。)在与数据搏斗之后,我成功地使用以下代码绘制了总人口:

#Set theme for histograms
theme_hist <- list(theme(panel.grid.minor = element_blank(),
                        panel.grid.major = element_blank(),
                        panel.background = element_blank(),
                        plot.background = element_blank(),
                        panel.border = element_blank(),
                        plot.title = element_text(size=22)))

#Plot map
pop_dist<-ggplot(aes(x=long,y=lat,group=group,fill=as.numeric(tot_pop)),data=co_mapd) + 
            geom_polygon(colour='white',size=.2) + 
            coord_equal() + 
            theme_opts + 
            labs(title='Distribution of Population') +
            scale_fill_gradient2(low='#ECE7F2',mid='#A6BDDB',high='#3300CC',
                                 midpoint=median(as.numeric(co_mapd$tot_pop)))
#ggsave('co_tract_pop_2010_map.png')

#Plot histogram
pop_hist<-ggplot(aes(x=as.numeric(tot_pop),group=group,fill=as.numeric(tot_pop)),data=co_mapd) + 
            geom_histogram() + 
            theme_hist +
            xlab('Population Bins') +
            scale_fill_gradient2(low='#ECE7F2',mid='#A6BDDB',high='#3300CC',
                                 midpoint=median(as.numeric(co_mapd$tot_pop)))
#ggsave('co_tract_pop_2010_hist.png')

#Throw plots on a single canvas
grid.arrange(pop_dist,pop_hist)

这生成了下面的地图和直方图: 第一个输出 在此处输入图像描述

我认为这对于我想做的事情来说是完美的,但我还有更多的变数。一个函数会很有用。所以,这是我的功能:

 map_var<-function(data,var,ttl){
        dist<-ggplot(aes(x=long,y=lat,group=group,fill=var),data=data) +  
        geom_polygon(colour='white',size=.2) + 
                coord_equal() + 
        theme_opts + 
        labs(title=ttl) +
        scale_fill_gradient2(low='#ECE7F2',mid='#A6BDDB',high='#3300CC',
                                 midpoint=median(data$var))

        hist<-ggplot(aes(x=var,group=group,fill=var),data=data) + 
        geom_histogram() + 
        theme_hist +
                xlab('Bins') +
                scale_fill_gradient2(low='#ECE7F2',mid='#A6BDDB',high='#3300CC',
                                midpoint=median(data$var))

        grid.arrange(dist,hist)
        }

    map_var(co_mapd,tot_pop,'Distribution of Population')

似乎它应该可以工作,因为我试图准确地反映我在函数包装器之外所做的事情。我从字面上复制和粘贴,只是更改了函数参数发挥作用的元素。但是,它最终会引发以下错误:

Error in data.frame(x = c(-107.48212, -107.482115, -107.482062, -107.48206,  : 
  arguments imply differing number of rows: 748351, 0

我还应该提到,在通过函数运行它之前,我将所有相关列转换为数字,因为函数中的 as.numeric() 给了我一些问题。

无论如何,我不清楚为什么参数会暗示函数中的行数不同,但当绘图代码独立时则不然。这让我觉得访问适当的环境正在发生一些时髦的事情,但我不确定是什么。任何帮助将不胜感激。

更新:我也尝试过 aes_string 路线(我以前不知道,所以谢谢你)。要么这不是问题,要么我误用了这项技术。

map_var<-function(data,var,ttl,coord_x,coord_y,group='group'){
    dist<-ggplot(aes_string(x=coord_x,y=coord_y,group=group,fill=var),data=data) + 
            geom_polygon(colour='white',size=.2) + 
            coord_equal() + 
            theme_opts + 
            labs(title=ttl) +
            scale_fill_gradient2(low='#ECE7F2',mid='#A6BDDB',high='#3300CC')

    hist<-ggplot(aes(x=var,group=group,fill=var),data=data) +
            geom_histogram() + 
            theme_hist +
            xlab('Bins') +
            scale_fill_gradient2(low='#ECE7F2',mid='#A6BDDB',high='#3300CC')

    grid.arrange(dist,hist)
    }

map_var(co_mapd,var='tot_pop',ttl='Distribution of Population',coord_x='long',coord_y='lat')

此版本引发以下异常...

Don't know how to automatically pick scale for object of type function. Defaulting to continuous
Error in data.frame(x = function (x, y = NULL, na.rm = FALSE, use)  : 
  arguments imply differing number of rows: 0, 748351

我仍然不清楚我使用的哪个参数暗示了除了完整的 data.frame 之外的任何内容(除了不清楚为什么它只在函数内部很重要)。

更新(8/20):我正在添加一个更新的代码块来合并 eval() 建议。

map_var<-function(data,var,ttl,coord_x,coord_y,group='group'){
    dist<-ggplot(aes_string(x=eval(coord_x),y=eval(coord_y),group=eval(group),fill=eval(var)),data=data) + 
            geom_polygon(colour='white',size=.2) + 
            coord_equal() + 
            theme_opts + 
            labs(title=eval(ttl)) +
            scale_fill_gradient2(low='#ECE7F2',mid='#A6BDDB',high='#3300CC')

    hist<-ggplot(aes(x=eval(var),group=eval(group),fill=eval(var)),data=data) +
            geom_histogram() + 
            theme_hist +
            xlab('Bins') +
            scale_fill_gradient2(low='#ECE7F2',mid='#A6BDDB',high='#3300CC')

    grid.arrange(dist,hist)
    }

map_var(co_mapd,var='tot_pop',ttl='Distribution of Population',coord_x='long',coord_y='lat')

我想明确分享,以防我执行不佳。但是,恐怕它并没有改变例外。

4

1 回答 1

1

对于那些以后可能会遇到这个问题的人来说,这很好用:

map_var<-function(data,var,ttl,coord_x,coord_y,group='group'){
    dist<-ggplot(aes_string(x=coord_x,y=coord_y,group=group,fill=var),data=data) + 
            geom_polygon(colour='white',size=.2) + 
            coord_equal() + 
            theme_opts + 
            labs(title=ttl) +
            scale_fill_gradient2(low='#ECE7F2',mid='#A6BDDB',high='#3300CC')

    hist<-ggplot(aes_string(x=var,group=group,fill=var),data=data) +
            geom_histogram() + 
            theme_hist +
            xlab('Bins') +
            scale_fill_gradient2(low='#ECE7F2',mid='#A6BDDB',high='#3300CC')

    grid.arrange(dist,hist)
    }

map_var(co_mapd,var='tot_pop',ttl='Distribution of Population',coord_x='long',coord_y='lat')

在上面的评论中向baptisteRoland致敬。非常感谢。

于 2013-08-21T00:34:09.387 回答