问题标签 [kolmogorov-smirnov]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
55 浏览

r - 正态混合分布

我正在尝试创建一个 qqplot 并针对 25% N(μ=0,σ=4) 和 75% N(μ=4,σ=2) 的正态混合分布运行 KS 测试。我怎样才能使我的 qqplot 和 KS 测试适应这个分布?我不认为我的 abline 是正确的,我的 KS 测试并没有真正正确地反映分布。

任何帮助,将不胜感激。

0 投票
1 回答
39 浏览

r - 使用字符向量分量作为 R 函数的参数

为了找到适合数据集的最佳分布,我需要将可能分布的字符向量中的一个分量(在此示例中故意缩短)作为参数传递给ks.test() R 函数。所以,我的问题与统计有关,更一般地说,与 R 编程有关。

我得到:

这是什么意思?我的错误在哪里?提前谢谢了。

0 投票
1 回答
46 浏览

graph - 如何导出 Kolmogorov–Smirnov?

我进行了两个样本的 Kolmogorov-Smirnov 检验。我想要一种将其导出为漂亮图表的方法。我知道简单的 OLS 回归有outreg2,但有没有可以用于 KS 测试的等价物?

0 投票
0 回答
49 浏览

python - 将拟合的 CDF 与经验数据进行比较

我已经对一些数据拟合了高斯分布和高斯混合分布,并根据经验数据绘制了模型 CDF,如下所示: 在此处输入图像描述

我试图使用 kstest 来量化和比较每个模型的拟合优度,但查看 scipys kstest 文档让我感到困惑。我是否像在其他帖子上看到的那样使用 kstest 或 ks_2samp?

编辑:对于上下文,我为一个示例 kstest 尝试过的代码是

其中 Y 是数据,y_cdf 是混合模型的 cdf,但是这给出了 1 个分量的 d 值低于 2 个分量的值,我很清楚 2 个分量的混合模型更适合,所以不应该 kstest 的 D 值更低?

0 投票
1 回答
75 浏览

python - 为什么在这种情况下 Kolmogorov-Smirnov 检验会失败?

我有这两个时间序列,我想测试它们是否来自同一个分布。所以我应用了scipy.stats.ks_2samp()测试。但是测试返回的 p 值为0.0028,而describe()给出了以下统计信息:

因此,当均值和标准差非常相似时,我不明白为什么测试会拒绝零假设。(累积)分布图也非常相似。

有谁能够帮助我?

这是我的数据和测试调用:

0 投票
0 回答
56 浏览

r - kSamples r 包中 Anderson-Darling 的事后多重比较测试

我正在使用 r 中的 kSamples 包来比较多个分布(> 2 个分布)。包中提供的测试测试样本来自同一分布的零假设。但是该软件包似乎没有提供用于多重比较的功能,以查看哪些分布彼此不同。

非常感谢任何帮助。我也愿意使用其他测试和包,所以请继续提出您的建议!

最小测试用例:

输出:

0 投票
1 回答
346 浏览

r - R:用于正态性检验的 Kolmogorov-Smirnov 检验可视化(经验 CDF 与理论 CDF 的比较)

我想使用 Kolmogorov-Smirnov 测试 (ks-test) 检查正常性并将其可视化以支持我的演示。

我使用了这个默认代码

结果是这样的: 在此处输入图像描述

现在,我想用我自己的数据替换它,

我可以mydata用作经验 CDF,但如何更改sample2为理论 CDF?

目标:

  • 2 cdf plot:经验CDF (mydata替代分布sample1)和理论CDF(替代sample2分布)
  • 出现最大差异的垂直线 +geom_pint加法

提前致谢。

0 投票
0 回答
57 浏览

python - 为什么在更改样本的分箱时,两样本 KS 检验给出相同的结果?

我必须测试两个样本的分布以检查它是否相同,所以我使用了ks_2sampScipy 的 Kolmogorov-Smirnov 测试。两个样本中的数据是连续的,但我将它们分箱以用于绘图目的。

我知道 KS 不适用于分箱样本,但我试图看看在测试分箱数据时会发生什么。即,我为每个 bin 分配了一个字母,并传递给ks_2samp两个数组,其中的字母对应于数据点所属的 bin。

为什么如果我更改 KS 测试的箱数(几乎)为统计量和 p 值产生相同的值?例如,如果我减少 bin 的数量,则生成的直方图(因此 pdf)会改变形状,所以我预计测试结果会有所不同。

此外,哪种统计测试最适合测试两个分箱数据样本的分布?

谢谢!

0 投票
0 回答
58 浏览

python - 我可以相信 python 中 Kolmogorov-Smirnov 测试的结果吗?

我的数据太少,使用 ks-test,得到 p-value = 0.96。p-value>0.05,结果显着,p-value大于0.05,数据呈现正态分布。从图表中画出结果如下。

但是根据图表,直观地说,我不认为这个结果看起来像一个正态分布。

我可以相信 ks-test 的结果吗?

正常配合

0 投票
1 回答
29 浏览

statistical-test - 如何使用 KS 测试检查两个结果是否具有可比性?

我在少数数据集上使用了两种算法(方法)并获得了一些结果。现在我想检查获得的结果是否具有可比性?我已经使用了两次采样的 KS 测试并得到了以下结果,现在如何解释测试结果?结论应该是什么?