我有一个如下图,我想知道它是否符合帕累托分布?它是一个累积的情节。而且,我想找出 x 轴上的点,它标志着 80-20 规则的点,即 x 轴点,它将情节分成 20% 拥有 80% 的财富。
另外,我真的对 scipy.stats Pareto 函数感到困惑,如果有人可以对此给出一些直观的解释,那就太好了,因为文档非常混乱。
我有一个如下图,我想知道它是否符合帕累托分布?它是一个累积的情节。而且,我想找出 x 轴上的点,它标志着 80-20 规则的点,即 x 轴点,它将情节分成 20% 拥有 80% 的财富。
另外,我真的对 scipy.stats Pareto 函数感到困惑,如果有人可以对此给出一些直观的解释,那就太好了,因为文档非常混乱。
scipy.stats.pareto 提供帕累托分布的随机抽取。
要知道您的分布是否符合帕累托分布,您应该执行 Kolmogorov-Smirnov 检验。使用 ,从帕累托分布中抽取一个随机样本pareto.rvs(shape, size=1000)
,其中shape
是帕累托分布的估计形状参数,并用于scipy.stats.kstest
执行测试:
pareto_smp = pareto.rvs(shape, size=1000)
D, p_value = scipy.stats.kstest(pareto_smp, values)
没有人可以简单地确定观察数据集是否遵循特定分布。根据您的情况,您需要什么:
使用以下方法拟合经验分布: statsmodels.ECDF
然后,将其与您的数据进行比较(非参数),以查看是否可以拒绝 Null 假设
对于 20/80 规则:将您的 X 重新缩放到范围 [0,1] 并在 x 轴上简单地选取 0.2