1

我使用 count(case..) 在 sql 中对年龄进行分组,最终得到以下数据框:

0-10    11-16   17-20   21-30   31-40   41-50   51-60   61-70   over70  age_unknown
60        285     161     368     476     453     247     101       62          114

我想转置它并添加列标题“年龄范围”和“数字”,但据我所知,重塑功能需要在开始时存在标题,所以我不知道该怎么做。非常感谢。

4

3 回答 3

1

您可能正在寻找的是stack. 使用 Gavin 回答中的数据:

> stack(df)
   values         ind
1      60        0-10
2     285       11-16
3     161       17-20
4     368       21-30
5     476       31-40
6     453       41-50
7     247       51-60
8     101       61-70
9      62      over70
10    114 age_unknown
于 2013-03-14T02:29:12.010 回答
1

如果这是一个像这样的 1 行数据框:

df <- data.frame(matrix(c(60, 285, 161, 368, 476, 453, 247, 101, 62, 114), 
                        nrow = 1))
names(df) <- c("0-10", "11-16", "17-20", "21-30", "31-40", "41-50",
               "51-60", "61-70", "over70", "age_unknown")
df

> df
  0-10 11-16 17-20 21-30 31-40 41-50 51-60 61-70 over70 age_unknown
1   60   285   161   368   476   453   247   101     62         114

然后一个简单的操作将以您想要的格式创建数据框:

df2 <- data.frame(age_range = names(df), number = as.numeric(df[1, ]))
df2

> df2
     age_range number
1         0-10     60
2        11-16    285
3        17-20    161
4        21-30    368
5        31-40    476
6        41-50    453
7        51-60    247
8        61-70    101
9       over70     62
10 age_unknown    114

一个更简单的方法可能是转置df使用t()然后修复结果:

df3 <- t(df)
df3 <- cbind.data.frame(rownames(df3), df3)
rownames(df3) <- NULL
names(df3) <- c("age_range","number")
df3

> df3
     age_range number
1         0-10     60
2        11-16    285
3        17-20    161
4        21-30    368
5        31-40    476
6        41-50    453
7        51-60    247
8        61-70    101
9       over70     62
10 age_unknown    114
> str(df3)
'data.frame':   10 obs. of  2 variables:
 $ age_range: Factor w/ 10 levels "0-10","11-16",..: 1 2 3 4 5 6 7 8 10 9
 $ number   : num  60 285 161 368 476 453 247 101 62 114
于 2013-03-13T21:01:28.800 回答
0

如果您有一些连续可变的年龄并且您想要的切割点是已知的:

age <- rnorm(100,40,10)
cutpoints <- c(0,10,20,30,40,50,60,70,max(age))

fage <- table( cut(age, breaks=cutpoints) )

fage本身可能就是您所需要的。但是,如果您真的想要数据框中的数据:

df <- data.frame(age=names(fage), frequency=as.vector(fage))
于 2013-03-13T21:01:11.063 回答