嗨……我有一个关于将加权数据输入 R 的非常基本的问题。目前我必须处理类似于以下的数据(主要用于曲线拟合目的):
> head(mydata, 10)
v sf
1 0.3003434 3.933106
2 0.3027852 5.947432
3 0.3052270 9.832596
4 0.3076688 12.927439
5 0.3101106 14.197519
6 0.3125525 13.572904
7 0.3149943 11.691078
8 0.3174361 9.543095
9 0.3198779 8.048558
10 0.3223197 7.660252
第一列是数据(增加和等距),而第二列给出频率(权重),目前这些权重加起来不等于一个,但我可以轻松解决这个问题。
现在,我在 R 中搜索加权数据,我发现最接近的是通过使用调查包和 svydesign() 命令,但这真的那么难吗?
我为解决我缺乏知识所做的工作,这让我在 Kolmogorov_Smirnov 测试中遇到了麻烦(更多下文),如下所示:
> y <- with(mydata, c(rep(v, times=floor(10*sf))))
这将与相应的权重成比例地重复第一列的元素(乘以 10 得到一个整数)。但现在的问题是,当我进行 Kolmogorov-Smirnov 拟合优度检验时,我收到一条警告,指出由于数据存在关联,因此无法计算 p 值。
问题是:如何以原始形式(即频率或概率表)输入和处理数据以进行曲线拟合?谢谢。