假设我们有两个样本data1
和data2
它们各自的权重weight1
,weight2
并且我们想要计算两个加权样本之间的 Kolmogorov-Smirnov 统计量。
我们在 python 中这样做的方式如下:
import numpy as np
def ks_w(data1,data2,wei1,wei2):
ix1=np.argsort(data1)
ix2=np.argsort(data2)
wei1=wei1[ix1]
wei2=wei2[ix2]
data1=data1[ix1]
data2=data2[ix2]
d=0.
fn1=0.
fn2=0.
j1=0
j2=0
j1w=0.
j2w=0.
while(j1<len(data1))&(j2<len(data2)):
d1=data1[j1]
d2=data2[j2]
w1=wei1[j1]
w2=wei2[j2]
if d1<=d2:
j1+=1
j1w+=w1
fn1=(j1w)/sum(wei1)
if d2<=d1:
j2+=1
j2w+=w2
fn2=(j2w)/sum(wei2)
if abs(fn2-fn1)>d:
d=abs(fn2-fn1)
return d
我们只是根据我们的目的修改在Press, Flannery, Teukolsky, Vetterling - Numerical Recipes in C - Cambridge University Press - 1992 - pag.626中实施的经典双样本 KS 统计量。
我们的问题是:
- 有人知道其他方法吗?
- python/R/* 中是否有任何库可以执行它?
- 测试呢?它是否存在或者我们应该使用重新洗牌程序来评估统计数据?