0

如果有人可以检查我的方法是否正确,那就太好了。简而言之,问题是,如果错误计算是正确的方法。假设我有以下数据。

data = c(23.7,25.47,25.16,23.08,24.86,27.89,25.9,25.08,25.08,24.16,20.89)

此外,我想检查我的数据是否遵循正态分布。

编辑:我知道有测试等,但我将专注于构建带有置信度线的 qqplot。我知道汽车包里有一个方法,但我想了解这些线路的构建。

所以我计算了我的样本数据以及我的理论分布的百分位数(估计mu = 24.6609sigma = 1.6828。所以我最终得到了这两个包含百分位数的向量。

percentileReal =  c(23.08,23.7,24.16,24.86,25.08,25.08,25.16,25.47,25.90)
percentileTheo =  c(22.50,23.24,23.78,24.23,24.66,25.09,25.54,26.08,26.82)

现在我想计算alpha=0.05理论百分位数的置信区间。如果我记得自己是正确的,则公式由下式给出

error = z*sigma/sqrt(n),
value = +- error

和。n=length(data)_z=quantil of the normal distribution for the given p

因此,为了获得第二个百分位数的置信区间,我将执行以下操作:

error = (qnorm(20+alpha/2,mu,sigma)-qnorm(20-alpha/2,mu,sigma))*sigma/sqrt(n) 

插入值:

error = (qnorm(0.225,24.6609,1.6828)-qnorm(0.175,24.6609,1.6828)) * 1.6828/sqrt(11)
error = 0.152985
confidenceInterval(for 2nd percentil) = [23.24+0.152985,23.24-0.152985]
confidenceInterval(for 2nd percentil) = [23.0870,23.3929]

最后我有

percentileTheoLower = c(...,23.0870,.....)
percentileTheoUpper = c(...,23.3929,.....)

其余的也一样......

那你怎么看,我可以去吗?

4

1 回答 1

0

如果您的目标是测试数据是否服从正态分布,请使用shapiro.wilk 测试

shapiro.test(data)
# Shapiro-Wilk normality test
# data:  data
# W = 0.9409, p-value = 0.5306

1-p是分布非正态的概率。所以,因为p>0.05我们不能断言分布是非正态的。粗略的解释是“分布正常的概率为 53%”。

您也可以使用qqplot(...). 该图越接近线性,您的数据就越有可能呈正态分布。

 qqnorm(data)

最后, R 中有nortest包,其中包括 Pearson Chi-Sq 正态性检验:

 library(nortest)
 pearson.test(data)
 #  Pearson chi-square normality test
 #  data:  data
 #  P = 3.7273, p-value = 0.2925

这个(更保守的)测试表明只有 29% 的概率分布是正态的。所有这些测试在文档中都有完整的解释。

于 2013-12-09T21:59:46.607 回答