我的目标是比较各种社会经济因素(例如收入)多年来的分布,以了解特定地区的人口在 5 年内如何演变。这方面的主要数据来自Public Use Microdata Sample。我使用R
+ggplot2
作为我的首选工具。
在比较两年的数据(2005 年和 2010 年)时,我有两个数据框hh2005
和两年hh2010
的家庭数据。两年的收入数据存储在hincp
两个数据框中的变量中。使用ggplot2
我将按如下方式创建各个年份的密度图(例如 2010 年):
p1 <- ggplot(data = hh2010, aes(x=hincp))+
geom_density()+
labs(title = "Distribution of income for 2010")+
labs(y="Density")+
labs(x="Household Income")
p1
如何在此图上叠加 2005 年的密度?我无法弄清楚它是否已阅读data
,因为hh2010
我不确定如何继续。我应该从一开始就以完全不同的方式处理数据吗?