我有一个非正态分布函数,我想计算它的矩(均值、方差、偏度和峰度)。我知道的包是e1071
计算moments
离散值向量的矩。是否有一个包可以估计连续分布函数的矩?作为一个例子,假设我有这个分布:
tmp <- runif(100,-10,10)
PDFdata <- density(tmp , kernel = "gaussian")
PDF <- splinefun(PDFdata$x , PDFdata$y)
现在我想计算:
我有一个非正态分布函数,我想计算它的矩(均值、方差、偏度和峰度)。我知道的包是e1071
计算moments
离散值向量的矩。是否有一个包可以估计连续分布函数的矩?作为一个例子,假设我有这个分布:
tmp <- runif(100,-10,10)
PDFdata <- density(tmp , kernel = "gaussian")
PDF <- splinefun(PDFdata$x , PDFdata$y)
现在我想计算:
您可以使用函数integrate
来计算矩。
您只需要定义一个被积函数,我int
在下面的代码中调用它。
首先,我将通过设置 RNG 种子使结果可重现。
set.seed(6126) # Make the results reproducible
tmp <- runif(100,-10,10)
PDFdata <- density(tmp , kernel = "gaussian")
PDF <- splinefun(PDFdata$x , PDFdata$y)
int <- function(x, c = 0, g = PDF, n = 1) (x - c)^n * g(x)
integrate(int, lower = -15, upper = 15, n = 1)
#-0.3971095 with absolute error < 7.8e-06
integrate(int, lower = -15, upper = 15, n = 2)
#35.76295 with absolute error < 0.0012
plot(PDFdata)
curve(PDF, -15, 15, add = TRUE, col = "blue", lty = "dashed")
如果您从数据中估计密度,最好使用数据中的经验矩来估计分布的矩。如果您只是将其用作函数的示例,那么您可以使用包中的integrate
函数stats
。例如,
set.seed(123)
tmp <- runif(100,-10,10)
PDFdata <- density(tmp , kernel = "gaussian")
PDF <- splinefun(PDFdata$x , PDFdata$y)
mean(tmp)
[1] -0.02882012
integrate(function(x) x*PDF(x), -Inf, Inf)
Error in integrate(function(x) x * PDF(x), -Inf, Inf) :
the integral is probably divergent
事实上,对于这个数据集,PDF
函数不是密度:
plot(PDF, from = -100, to = 100)
所以我们在密度估计范围之外强制它为零:
PDF2 <- function(x) ifelse(x < min(PDFdata$x) | x > max(PDFdata$x), 0,
PDF(x))
integrate(function(x) x*PDF2(x), -Inf, Inf)
-0.02900585 with absolute error < 8.2e-05