2

我在 csv 文件中有一个降雨值的时间序列。我绘制了数据的直方图。直方图向左倾斜。我想转换这些值,使其具有正态分布。我使用了 R 中可用的 Yeo-Johnson 变换。变换后的值在此处

我的问题是:

在上述转换中,我对 lambda 使用了 0.5 的测试值,效果很好。是否可以根据时间序列确定 lambda 的最佳值?我会很感激任何建议。

到目前为止,这是代码:

library(car)
dat <- scan("Zamboanga.csv")
hist(dat)
trans <- yjPower(dat,0.5,jacobian.adjusted=TRUE)
hist(trans)

这是 csv 文件

4

1 回答 1

2

首先通过使用boxCoxcar 包中的函数通过最大似然估计 λ 来找到最佳 lambda。

您可以像这样绘制它:

boxCox(your_model, family="yjPower", plotit = TRUE)

简历中的例子

正如 Ben Bolker 在评论中所说,这里的模型可能类似于

your_model <- lm(dat~1)

然后在现有代码中使用优化的 lambda。

于 2016-11-07T01:34:33.987 回答