问题标签 [kolmogorov-smirnov]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
214 浏览

r - 设置 ewcdf {spatstat} [R] 的权重

我想将参考分布与使用 Kolmogorov-Smirnov 距离按比例绘制d_1的样本进行比较。d_2w_1

鉴于这d_2是加权的,我正在考虑使用 R 中的加权经验累积分布函数(使用ewcdf {spatstat})来解决这个问题。

下面的例子表明我可能没有指定权重,因为当lenght(d_1) == lenght(d_2)Kolmogorov-Smirnov 没有给出 0 值时。

有人可以帮我弄这个吗?为清楚起见,请参阅下面的可重现示例。

0 投票
0 回答
1570 浏览

python - 如何在 python 中为 2 个示例字符串列表创建 Kolmogorov-Smirnov 图表?

我在为 2 个将显示累积分布函数 (CDF) 的示例字符串列表创建 Kolmogorov-Smirnov 图表时遇到困难?

两样本 Kolmogorov–Smirnov 检验所示

我已经能够计算出Ks_2sampResult(statistic=0.12939662567915355, pvalue=0.4183080902726968)整个字符串列表,但困难在于如何绘制图表以显示累积频率分布 (CFS)

数据列表示例

列表 1 的子集,例如['team', 'new', 'estate', 'ho', 'ur', 'la', 'pak', 'ebay', 'biz', 'best']

列表 2 的子集,例如['ilsilenzio', 'stilllife', 'mathiasboe', 'achininimeshikaratnasiri', 'andrewdabeka', 'davekhodabux', 'lilytermetz', 'marianhorsley', 'lindacloutier', 'moniquehoogland',]

获取数据列表

绘制 CDF

在此处输入图像描述

0 投票
1 回答
105 浏览

python - MultiIndex Dataframe 将一个原始索引与其他索引进行比较

我有一个以列表为值的数据框。

df

我想在每行和其他行的串联之间进行分组name并运行 Kolmogorov-Smirnov 测试 ( )。scipy.stats.ks_2samp名称的示例a{file1,a}== [1,1]。其他人的串联{file2,a}+ {file3,a}== [2,2,2]+ [1]== [2,2,2,1]。他们之间的 KStest 是stats.ks_2samp([1,1], [2,2,2,1])== 0.75。我怎样才能得到下面的预期结果(手动完成)?

如果这个问题太临时,我很抱歉。

下面是我的尝试。我无法弄清楚如何优雅地将目标行从其他行中排除。

0 投票
1 回答
225 浏览

r - 如何创建一个循环或函数来循环遍历包含变量的两个向量列表以对响应运行 KS 测试

为方便起见,我简化并概括了问题的代码。

所以我的问题(即 R 问题)是我试图循环通过一组 Kolmogorov Smirnov ks.boot 测试,以针对两个因素的多个级别进行测试。我需要对向量 df.test$names 的每个级别的数据进行子集化(例如 W、X、Y 和 Z 代表物种名称),然后循环比较 df.test$TSM.FACT 的每个级别之间的长度分布(例如 A、B、C 等代表时间段)。

因此,对于 df.test$names 中的每个级别(例如 W、X、Y、Z),我需要比较它们在不同时间段 A 和 B 的长度分布;然后是 A 与 C,然后是 B 与 C,并将每个结果保存在数据框中;记录比较发生的地方。

0 投票
1 回答
1586 浏览

python-3.x - Python 比较分布:SciPy ks_2samp p 值始终为 0.0

我正在尝试比较两个分布,看看它们是相似还是不同。我尝试使用 python scipy 包中的 ks_2samp。这是我的代码,

为什么我的输出p-value总是0.0?任何帮助都非常感谢。谢谢!

0 投票
1 回答
190 浏览

c - Kolomogorov-Smirnov 测试:C 到 R 翻译问题

我很难将算法从 C 转换为 R。这是关于 Kolmogorov Smirnov 测试,更具体地说是 KS 概率函数

在此处输入图像描述
在“C中的数字食谱”,“probks”中,它被编码为

我不知道如何处理最后几行的 R 中的翻译,我现在只有

但这会产生一个非单调的概率函数 在此处输入图像描述

其中应该是 $Q_KS(0) = 1$ 和 $Q_KS(\infty) = 0$。显然,这是关于如何解释/编码最后一个“if”语句。

任何帮助将不胜感激。米

编辑 1: 这里是我的会话信息

编辑 2 使用 Konrad 的函数 ks_cdf 和

仍然在 0 处给出 0 在此处输入图像描述

编辑 3 升级到 3.6.1 后

我仍然得到与上面相同的情节,即 ks_cdf(0)=0 而它应该是 ks_sdf(0)=1

0 投票
1 回答
1471 浏览

python - 当我在python中使用ks测试时,为什么我的p值等于0而统计量等于1?

感谢任何先看的人。

我的代码是:

kstest 的结果是 KstestResult(statistic=1.0, pvalue=0.0)。代码有什么问题还是数据根本不正常?

0 投票
1 回答
168 浏览

r - 数据框中的输出循环 Kolmogorov Smirnov 测试(ks.test)

我想将循环中记录的 ks.test 的输出合并到数据帧或文件中,而不是在控制台中打印 1155 个测试的输出... :-)。

我想要一个包含以下列的 data.frame:col1 和 col2 的名称(方程值)、p 值和 D 值。

乌托邦数据框

非常感谢您提前!!

0 投票
1 回答
714 浏览

python - Python单面KS-Test

我已经针对大量理论概率分布对我的分布进行了单边 KS 测试(观察公共交通公共交通网络的占用情况,值从 0 到 100):

根据我对单面 KS-Test 的理解,最适合我的数据的理论分布是单面 KS-Test 返回大 p 值和低 D-KSstatistic 值的分布。

据此,最佳拟合是:

此外,当我尝试将这些所谓的最佳拟合分布直观地拟合到我的数据时,有些东西并没有加起来:

结果似乎与我的数据不匹配 invgauss、invweibull 或 genextreme 概率分布。

在此处输入图像描述

我做错了什么或假设 KS 测试结果有问题吗?

我的分布中的数据样本:

解决方案

请参阅接受的答案以获取更多详细信息。仅供参考,在估计正确的参数并将其传递给单边 KS 测试认为与我自己的分布相似的最相似的理论分布后,我能够直观地确认分布相似性。

在此处输入图像描述

0 投票
0 回答
116 浏览

python-3.x - 如何对两个离散的归一化概率分布函数应用 KS 检验?

想象有一个球形体积,里面装满了不同大小的黑色球体。在投影中,有一些被这些球体相交的蓝色区域。蓝色误差条来自与蓝色区域(投影中)相交的球体的概率分布,而黑色误差条来自与随机光束相交的球体的概率分布。下图显示了两个归一化和离散的概率密度函数。如何使用KS方法或任何其他方法显示蓝色PDF是从黑色PDF中获取的?

在此处输入图像描述