我有一个名为income.df 的数据框,看起来像这样:
ID region income
1 rot 3700
2 ams 2500
3 utr 3300
4 utr 5300
5 utr 4400
6 ams 3100
8 ams 3000
9 rot 4000
10 rot 4400
12 rot 2000
我想使用Gini函数来计算每个区域的 Gini 系数。如果我想为整个数据帧计算它,而不考虑区域,我会执行以下操作:
library(DescTools)
Gini(income.df$income, n = rep(1, length(income.df$income)), unbiased = TRUE, conf.level = NA, R = 1000, type = "bca", na.rm = TRUE)
有没有办法为数据框中的每个区域执行此操作?那么在这种情况下“rot”、“utr”和“ams”呢?请注意,Gini 函数还需要其中向量的长度(三个区域分别为 4、3 和 3)。我怀疑像 lapply 这样的东西可以做到这一点,但我不知道如何在函数中自动传递这些长度(我的实际数据框要大得多,所以手动不是一个选项)。