我正忙着在 SQLite 中乱搞,想根据人均收入中位数和每个县的人口计算每个美国州的基尼系数。
该过程在这里解释:https ://medium.com/google-cloud/calculating-gini-coefficient-in-bigquery-3bc162c82168
只有我不知道如何为我的特定数据集执行此操作。我知道我需要确定每个县的收入和人口百分比,然后将每个州的数据汇总以获得累积值,但除此之外我完全迷失了。
然后输出将是每个州的基尼系数,但不知道如何使用这些值创建一个新实体。
我的数据集示例如下,虽然不完整,但应该有足够的数据让它工作。
状态 | 县 | 总流行音乐 | 人均收入 | |
---|---|---|---|---|
阿拉巴马州 | 奥陶加 | 55221 | 24974 | |
阿拉巴马州 | 鲍德温 | 195121 | 27317 | |
阿拉巴马州 | 巴伯 | 26932 | 16824 | |
阿拉巴马州 | 比布 | 22604 | 18431 | |
阿拉巴马州 | 布朗特 | 57710 | 20532 | |
阿拉巴马州 | 犍 | 10678 | 17580 | |
阿拉巴马州 | 巴特勒 | 20354 | 18390 | |
阿拉巴马州 | 卡尔霍恩 | 116648 | 21374 | |
阿拉巴马州 | 钱伯斯 | 34079 | 21071 | |
阿拉巴马州 | 切诺基 | 26008 | 21811 | |
阿拉斯加州 | 布里斯托尔湾区 | 970 | 38267 | |
阿拉斯加州 | 德纳利区 | 2060 | 35315 | |
阿拉斯加州 | 迪林厄姆人口普查区 | 4979 | 22257 | |
阿拉斯加州 | 费尔班克斯北极星自治市镇 | 99705 | 33244 | |
阿拉斯加州 | 海恩斯自治市镇 | 2560 | 33902 | |
阿拉斯加州 | Hoonah-Angoon 人口普查区 | 2128 | 30943 | |
阿拉斯加州 | 朱诺市和自治市镇 | 32531 | 39979 | |
阿拉斯加州 | 基奈半岛自治市镇 | 57221 | 31537 | |
阿拉斯加州 | 凯奇坎门户自治市镇 | 13699 | 32021 | |
阿拉斯加州 | 科迪亚克岛自治市镇 | 13973 | 30657 |