2

我正在尝试为我的数据获得最佳分布。装配完成如下图所示,但我需要测量,以选择最佳模型。我将拟合优度与卡方值进行了比较,并使用 Kolmogorov-Smirnov (KS) 检验来检验观察分布和拟合分布之间的显着差异。我搜索了一些潜在的解决方案1 , 2 , 3但我没有得到答案。从下图中的结果:

  1. 如果p-value高于k-statistic,是否意味着我们可以接受假设或数据很好地拟合分布?

  2. 或者,是否可以比较level of significance(a=0.005)p-value决定接受或拒绝假设?如果p-value低于a,则很可能两个分布不同。

  3. 对于Kolmogorov-Smirnov test,是否必须标准化数据 (-1,1) ?

  4. 从 KS 统计量和 P 值来看,最exponnorm适合数据。那是对的吗?

在此处输入图像描述

我通过以下方式计算了 P 值:

for distribution in dist_names:
    # Set up distribution and get fitted distribution parameters
    dist = getattr(scipy.stats, distribution)
    param = dist.fit(y_std)   
    p = scipy.stats.kstest(y_std, distribution, args=param)[1]
    p = np.around(p, 5)
    p_values.append(p) 
4

1 回答 1

2
  1. 不,您可以将 K 统计量与 K 检验临界值表中的临界值进行比较,也可以将 p 值与显着性水平(在您的情况下为 0.005)进行比较。
  2. 对,在统计学中,如果 p 值很小,我们拒绝空值并接受替代值。
  3. 不,如果我们在应用 KS-test 之前对数据进行标准化,我们会丢失有关原始数据分布的信息。例如,如果数据来自几何分布,则在归一化后,随着样本数趋于无穷大,它将在分布中收敛为正态 (0,1)。
  4. 是的,因为在这种情况下 p 值 > a,我们无法拒绝我们的 null 并接受这个输入数据具有与 exponnorm 相同的分布。
    顺便说一句,这个问题应该属于Cross Validated,因为它或多或少与统计知识有关。希望这个答案对您有所帮助。
于 2020-09-29T03:10:52.697 回答