我正在研究某个职业的收入增长率在收入分配的不同部分是否存在显着差异,以查看收入差距是否在显着扩大或缩小。
QUANTREG 模型
我在 SPSS 中执行了分位数回归(我是编码新手,只有 Python 的基本知识,所以我需要你的帮助)。因变量是指数收入,自变量是时间(该数据集中的季度)、人口统计组、专业领域。我还添加了每个虚拟人的交互项和时间变量。
所以(至少在我看来),这个模型允许在三个层次上比较收入的变化:
- 属于某个人口群体或细分市场如何影响收入(例如,与数据输入工作相比:数据分析增加 100 欧元,数据科学增加 200 欧元)
- 每个不同类别/虚拟对象的影响如何随时间变化(例如,与数据输入工作相比,成为数据科学家的积极影响增加了 10%,现在增加了 220 欧元)
- 这些变化的影响在收入分配的不同部分之间有何不同(例如,time*data_scientist 的系数在 90%Q 中比在 10%Q 中大得多,表明收入较高的数据科学家看到了更大的增长随着时间的推移,收入低于收入较低的数据科学家)
问题
所以我在 SPSS 上得到了这个分位数回归的输出,这是一个包含所有系数及其显着性和置信区间的巨大表格。
现在我想弄清楚90%Q和10%Q之间的差异在统计上是否显着,以便说明这个行业的收入差距是显着增加还是减少。我想在 Python 而不是 SPSS 上执行此操作,我搜索了如何将数据切割成分位数,以及如何执行分位数回归。但是应该如何测试 90%Q 和 10%Q 之间差异的显着性呢?