0

这是我第一次发布问题,所以可能没有正确的信息开始,提前道歉。我是 R 新手。更喜欢使用 dplyr 或 tidyverse,因为这些是我们迄今为止使用的软件包。我确实搜索了一个类似的问题,但大多数与性别/性别相关的问题都是关于分离数据,或者分别对每个数据执行操作。

我有一张人口计数表,其中包含变量(因素)年龄范围、年份和性别,人口作为因变量。我想创建一个图表来显示人口是否正在老龄化 - 即显示不同年龄组的相对比例如何随时间变化。但是性别无关紧要,所以我想将每个年份和年龄范围的男性和女性的人口数量加在一起。

我不知道如何提供原始数据 .csv 文件的副本,所以如果您有任何建议,请告诉我。

这是数据示例(输出表): 输出表

这是到目前为止的代码:

 file_name <- "AusPopDemographics.csv"
AusDemo_df = read.table(file_name,",", header=TRUE)

(grp_AusDemo_df <- AusDemo_df %>% group_by(Year, Age))

我猜可能类似于 pivot(wider) 将男性和女性作为列标题,然后 transmute() 对它们求和并创建一个新的人口列。

谢谢你的帮助。

4

1 回答 1

0

dplyr可以做这样的事情

library(dplyr)
grp_AusDemo_df <- AusDemo_df %>% 
  group_by(Year, Age) %>%
  summarise(Population = sum(Population, na.rm = TRUE)) 
于 2020-09-07T06:20:56.423 回答