4

我想使用 R 中 propogate 包中的 predictNLS 围绕大量拟合值建立置信区间。例如,我将使用它们在函数描述中引用的数据集(https://rdrr.io/github/anspiess /propagate/man/predictNLS.html )、DNase,并构建一个将值 conc 和 density 作为特征的模型:

library(propogate)
library(dplyr)
library(modelr)

DNase <- DNase

modeldna <- DNase %>% group_by(Run) %>% 
  do(run_model = nls(density ~ a * exp(b * conc), 
start = list(a = 1 , b = 0.5), 
data = .)) %>% ungroup()

然后我想给每一行分配它的模型,以便可以添加预测:

DNApredict <- full_join(as_tibble(DNase), modeldna, by = "Run")

添加预测:

DNApredict <- DNApredict %>% 
  group_by(Run) %>% 
  do(add_predictions(., var = "predicted_density", first(.$run_model)))

然后,我想添加 predictNLS 似乎提供的置信区间数据,方法是为其提供相同的数据并要求它为 predict_density 列中的每个拟合点提供置信区间:

confidence_interval <- predictNLS(model = modeldna, newdata = DNApredict$predicted_density, interval = "confidence")

但是,会出现以下错误:

as.list(object$call$formula) 中的错误:缺少参数“object”,没有默认值

有谁知道这可能是什么原因造成的?我知道对你们中的一些人来说,它所调用的对象是什么似乎很明显,所以如果这是一个荒谬的问题,我深表歉意。我真的希望能够使用此功能围绕一系列拟合值创建置信区间。非常感谢您提前。

4

1 回答 1

2

由于您在示例数据集中的nlseach上运行Run,因此通过将每个运行拆分为自己的数据帧并nls在每个数据帧上运行使用,很容易获得 nls 模型的列表lapply

library(propagate)

DNase <- DNase

modeldna <- DNase %>% split(DNase$Run)

models <- lapply(modeldna, function(d) nls(density ~ a * exp(b * conc), 
                                           start = list(a = 1 , b = 0.5), 
                                           data = d))

predictNLS现在我们可以通过在每个模型上运行(再次在内部lapply)轻松地获得每个模型中每个点的预测

results <- lapply(seq_along(modeldna), function(i) {
 predictNLS(models[[i]], newdata = data.frame(conc = modeldna[[i]]$conc))
})

由于 的输出结构predictNLS,我们需要提取每一行的预测并将它们强制转换为数据帧:

predictions <- lapply(results, function(x) {
  as.data.frame(do.call(rbind, lapply(x$prop, function(y) y$prop)))})

最后,我们可以将我们的预测(包括置信区间)粘贴回原始数据框:

all_results <- do.call(rbind, lapply(seq_along(modeldna), 
                      function(i) cbind(modeldna[[i]], predictions[[i]])))

现在,这为我们提供了原始数据点的完整数据框,以及带有置信区间的相关预测。

为了证明这一点,我们可以将结果绘制在ggplot. 在这里,我们为每次运行显示一个图,包括其原始数据、以虚线表示的预测值以及以淡蓝色丝带表示的 95% 置信限:

library(ggplot2)

ggplot(all_results, aes(x = conc, y = density)) +
  geom_ribbon(aes(ymin = `2.5%`, ymax = `97.5%`), 
              fill = "deepskyblue4", alpha = 0.2) +
  geom_point() +
  geom_line(aes(y = Mean.1), linetype = 2) +
  facet_wrap(.~factor(Run, levels = 1:11)) +
  theme_bw()

在此处输入图像描述

于 2021-10-28T11:54:31.483 回答