我使用fastgini
Stata 的包(https://ideas.repec.org/c/boc/bocode/s456814.html)。
我熟悉 Karagiannis & Kovacevic (2000) ( http://onlinelibrary.wiley.com/doi/10.1111/1468-0084.00163/abstract )中报告的基尼系数经典公式
公式一:
这里 G 是基尼系数,μ 是分布的平均值,N 是样本量,y_i 是第 i 个样本单元的收入。因此,基尼系数计算数据中所有可用收入对之间的差异,并计算所有绝对差异的总和。
然后通过将其除以人口平方乘以平均收入(并乘以 2?)来标准化这个总数。
基尼系数介于 0 和 1 之间,其中 0 表示完全平等(所有人的收入都相同),1 表示最大不平等(1 人获得了该国的所有收入)。
但是,该fastgini
软件包引用了一个不同的公式(http://fmwww.bc.edu/repec/bocode/f/fastgini.html):
公式二:
fastgini uses formula:
i=N j=i
SUM W_i*(SUM W_j*X_j - W_i*X_i/2)
i=1 j=1
G = 1 - 2* ----------------------------------
i=N i=N
SUM W_i*X_i * SUM W_i
i=1 i=1
其中观察按 X 的升序排序。
这里 W 似乎是我不使用的重量,因此它应该是 1(?)。我不确定公式 I 和公式 II 是否相同。没有绝对差异,结果从公式 II 中的 1 中减去。我试图转换方程,但我没有得到任何进一步的信息。
有人可以提示我两种计算方式(公式 I + 公式 II)是否等效?