问题标签 [kolmogorov-smirnov]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
64736 浏览

r - R中的Kolmogorov-Smirnov检验

我尝试使用 Kolmogorov-Smirnov 检验来检验样本的正态性。这是我所做的一个简单的小例子:

这是 R 给我的结果:

p 值非常低,而测试应该接受零假设。

我不明白为什么它不起作用。

0 投票
1 回答
554 浏览

statistics - Kolmogorov-Smirnov 检验中的假设检验 - 无论是临界值还是 p 值

我是统计学的新手。我正在尝试一个样本 Kolmogorov-Smirnov 测试。我能找到直到 D max。但是我很困惑继续进行假设检验。

为了确定假设,我应该向前推进——

表中的临界值

如果检验统计量 D 大于从表中获得的临界值,则拒绝

或者

KS Statustic 值的 p 值。

哪个更好?读到 p 值更好。在他们告诉“ kstest 决定通过将 p 值 p 与显着性水平 Alpha 进行比较来拒绝零假设,而不是通过将检验统计量 ksstat 与临界值 cv 进行比较。由于 cv 是近似值,因此将 ksstat 与 cv 进行比较偶尔会导致与比较 p 和 Alpha 不同的结论。

但找不到任何关于相同的方程。

参考

在上述参考文献中,我怀疑他们是否将 D max 作为 p 值。

请指教

0 投票
0 回答
38 浏览

java - SmirnovTest 中的异常

对于给定的数据集和代码,SmirnovTest 显示给定的异常-

data1[30]= {190.0, 173.33, 174.67, 174.0, 177.33, 171.33, 166.0, 184.0, 176.67, 179.33, 163.33, 152.0, 175.33, 147.33, 169.33, 183.33, 196.0, 170.0, 176.0, 142.0, 168.0, 173.33, 179.33、154.67、160.67、175.33、158.0、159.33、158.0、171.33};

数据2[20]= {46.04, 23.8, 23.29, 15.35, 52.62, 59.46, 42.02, 50.31, 32.07, 16.87, 16.72, 62.91, 48.74, 52.87, 57.32, 15.61, 59.3, 2.61, 59.3, 4.66

SmirnovTest 测试=新 SmirnovTest(data1, data2);

test.getSP();

test.getTestStatistic();

线程“主”java.lang.IllegalArgumentException 中的异常:无效 SP -3.126388037344441E-13

数据集有问题吗?

0 投票
0 回答
1828 浏览

r - Kolmogorov-Smirnov 一个样本测试

我使用了以下代码,但它显示如下:

并且本书给出的计算答案D与上面给出的答案不同。我只是试图对我书中给出的内容进行编码。

0 投票
0 回答
577 浏览

r - 两个分布之间的 Kolmogorov-Smirnov 检验 - R

我在同一个网格上计算了两个分布(也就是说,对于网格的每个点,我知道该点每个 CDF 的值)。

我想检查两个分布是否相同。我不能使用该ks.test命令,R因为该命令评估来自两个分布的绘制,检查两个经验分布之间的距离。

然而,作为在同一点网格上计算的两个分布,原假设永远不会被拒绝。我怎样才能在 R 中做到这一点?

0 投票
1 回答
2077 浏览

r - 两侧 ks 测试循环,得到 p.value

我有一列数据,我从中抽取 50% 的随机子样本。我正在运行一个双边 ks 测试,以将数据的分布50%与 100% 的数据进行比较,以查看分布是否仍然显着拟合。

为了实现我的目标,我想将其作为 1000 个循环运行,以从 1000 个随机子样本中获得平均 p 值。这行代码为我的样本的 50% 的随机子集提供了一个 p 值:

我需要一行代码运行 1000 次,每次将结果(不同的)p 值保存在我可以平均的列中。我试图开始工作的代码如下所示:

但是,这不存储多个 p 值

也试过这个:

我希望这很清楚,我将不胜感激任何帮助解决这个问题!

0 投票
1 回答
2100 浏览

python - Spark(Python)中的Kolmogorov Smirnov测试不起作用?

我在 Python spark-ml 中进行了正态性测试,发现了我认为的错误。

这是设置,我有一个标准化的数据集(范围-1,到1)。

当我做直方图时,我可以清楚地看到数据不正常:

当我运行 Kolmgorov-Smirnov 测试时,我得到以下结果:

Kolmgorov-Smirnov 检验将零假设 (H0)定义为:数据遵循指定的分布( http://www.itl.nist.gov/div898/handbook/eda/section3/eda35g.htm )。

在这种情况下,p 值非常低,因此我们应该拒绝原假设。这是有道理的,因为这显然是不正常的。

那么,为什么它会说:

这不是错的吗?它不应该说样本不遵循理论分布吗?我错过了什么吗?

0 投票
2 回答
3470 浏览

python - 在 python 中使用学生的 t 分布进行 KS 测试时要使用哪些参数?

我有关于恒星金属丰度的数据,我想将其与学生的 t 分布进行比较。为此,我在 python 上使用 scipy.stats.kstest 运行 Kolmogorov-Smirnov 测试 KSstudentst = scipy.stats.kstest(data,"t",args=(a,b)) 但我无法找到参数应该是什么。我知道学生的 t 需要一个自由度 (df) 参数,但另一个参数是什么。两者中的哪一个是 df 参数。在 scipy.stats.t.cdf 的文档中,输入是要计算值的位置和 df,但在 KS 测试中,提供该位置是没有意义的。

0 投票
2 回答
2935 浏览

c - c++ 中的 kolmogorov smrinov 测试

我用 C++ 为 Kolmogorov Smrinov 测试编写了一个程序,但它不起作用。它没有返回 d+(dp), d-(dn) 一个正确的值。我在程序中找不到任何错误。请大侠们快点帮忙。我认为在函数 dplus 和 dminus 的函数中作为 arg 传递的数组存在一些错误。注意:- 此程序仅适用于 alpha 值为 0.05 且列表值为 0.565 的分布

0 投票
3 回答
1826 浏览

python - 来自非参数测试的极低 p 值

我正在使用 Python 的非参数测试来检查两个样本是否与从相同的潜在父群体中抽取一致:scipy.stats.ks_2samp(2-sample Kolmogorov-Smirnov)、scipy.stats.anderson_ksamp(Anderson-Darling for k samples)和scipy.stats.ranksums(Mann-Whitney- Wilcoxon 用于 2 个样品)。我说两个样本之间存在显着差异的显着性阈值是 p = 0.01。

如果这三个测试返回极低的 p 值(有时像 10^-30 或更低),那么我是否需要担心 scipy 函数出了问题?这些小得离谱的 p 值是否可靠,我可以只报告 p << 0.01(p 远小于我的阈值)吗?