0

嗨……我有一个关于将加权数据输入 R 的非常基本的问题。目前我必须处理类似于以下的数据(主要用于曲线拟合目的):

    > head(mydata, 10)
       v        sf
    1  0.3003434  3.933106
    2  0.3027852  5.947432
    3  0.3052270  9.832596
    4  0.3076688 12.927439
    5  0.3101106 14.197519
    6  0.3125525 13.572904
    7  0.3149943 11.691078
    8  0.3174361  9.543095
    9  0.3198779  8.048558
    10 0.3223197  7.660252

第一列是数据(增加和等距),而第二列给出频率(权重),目前这些权重加起来不等于一个,但我可以轻松解决这个问题。

现在,我在 R 中搜索加权数据,我发现最接近的是通过使用调查包和 svydesign() 命令,但这真的那么难吗?

我为解决我缺乏知识所做的工作,这让我在 Kolmogorov_Smirnov 测试中遇到了麻烦(更多下文),如下所示:

    > y <- with(mydata, c(rep(v, times=floor(10*sf))))

这将与相应的权重成比例地重复第一列的元素(乘以 10 得到一个整数)。但现在的问题是,当我进行 Kolmogorov-Smirnov 拟合优度检验时,我收到一条警告,指出由于数据存在关联,因此无法计算 p 值。

问题是:如何以原始形式(即频率或概率表)输入和处理数据以进行曲线拟合?谢谢。

4

0 回答 0