8

我已尝试搜索有关此主题的其他线程,但没有一个修复程序对我有用。我有一个自然实验的结果,我想显示一个事件的连续发生次数符合指数分布。我的 R shell 粘贴在下面

f <- function(x,a,b) {a * exp(b * x)}
> x
 [1]  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
[26] 26 27
> y
 [1] 1880  813  376  161  100   61   31    9    8    2    7    4    3    2    0
[16]    1    0    0    0    0    0    1    0    0    0    0    1
> dat2
    x    y
1   1 1880
2   2  813
3   3  376
4   4  161
5   5  100
6   6   61
7   7   31
8   8    9
9   9    8
10 10    2
11 11    7
12 12    4
13 13    3
14 14    2
> fm <- nls(y ~ f(x,a,b), data = dat2, start = c(a=1, b=1)) 
Error in numericDeriv(form[[3L]], names(ind), env) : 
  Missing value or an infinity produced when evaluating the model
> fm <- nls(y ~ f(x,a,b), data = dat2, start = c(a=7, b=-.5)) 
Error in nls(y ~ f(x, a, b), data = dat2, start = c(a = 7, b = -0.5)) : 
  singular gradient
> fm <- nls(y ~ f(x,a,b), data = dat2, start = c(a=7,b=-.5),control=nls.control(maxiter=1000,warnOnly=TRUE,minFactor=1e-5,tol=1e-10),trace=TRUE) 
4355798 :   7.0 -0.5
Warning message:
In nls(y ~ f(x, a, b), data = dat2, start = c(a = 7, b = -0.5),  :
  singular gradient

请原谅格式不好,先在这里发帖。x 包含直方图的 bin,y 包含该直方图中每个 bin 的出现次数。dat2 在 14 处截止,因为 0 计数箱会抛出指数回归,我真的只需要适合前 14 个。那些计数超过 14 的箱我有生物学理由相信它们是特殊的。我最初遇到的问题是无穷大,因为没有一个值是 0,所以我没有得到。在按照此处不同帖子的建议给出不错的起始值后,我得到了奇异梯度错误。我看到的唯一其他帖子有更多变量,我尝试增加迭代次数,但没有成功。任何帮助表示赞赏。一个

4

2 回答 2

19

1)线性化以获得起始值您需要更好的起始值:

# starting values
fm0 <- nls(log(y) ~ log(f(x, a, b)), dat2, start = c(a = 1, b = 1))

nls(y ~ f(x, a, b), dat2, start = coef(fm0))

给予:

Nonlinear regression model
  model: y ~ f(x, a, b)
   data: x
        a         b 
4214.4228   -0.8106 
 residual sum-of-squares: 2388

Number of iterations to convergence: 6 
Achieved convergence tolerance: 3.363e-06

1a)类似地,我们可以lm通过编写来获取初始值

y ~ a * exp(b * x)

作为

y ~ exp(log(a) + b * x)

并取两者的对数以获得在 log(a) 和 b 中线性的模型:

log(y) ~ log(a) + b * x

可以使用以下方法解决lm

fm_lm <- lm(log(y) ~ x, dat2)
st <- list(a = exp(coef(fm_lm)[1]), b = coef(fm_lm)[2])
nls(y ~ f(x, a, b), dat2, start = st)

给予:

Nonlinear regression model
  model: y ~ f(x, a, b)
   data: dat2
       a        b 
4214.423   -0.811 
 residual sum-of-squares: 2388

Number of iterations to convergence: 6 
Achieved convergence tolerance: 3.36e-06

1b)我们也可以通过重新参数化来让它工作。在这种情况下,只要我们按照参数转换来转换初始值,a = 1 和 b = 1 就会起作用。

nls(y ~ exp(loga + b * x), dat2, start = list(loga = log(1), b = 1))

给予:

Nonlinear regression model
  model: y ~ exp(loga + b * x)
   data: dat2
  loga      b 
 8.346 -0.811 
 residual sum-of-squares: 2388

Number of iterations to convergence: 20 
Achieved convergence tolerance: 3.82e-07

所以 b 如图所示,a = exp(loga) = exp(8.346) = 4213.3

2) plinear 另一种更容易的可能性是使用alg="plinear"在这种情况下,线性输入的参数不需要起始值。在这种情况下,问题中的起始值b=1似乎就足够了。

nls(y ~ exp(b * x), dat2, start = c(b = 1), alg = "plinear")

给予:

Nonlinear regression model
  model: y ~ exp(b * x)
   data: dat2
        b      .lin 
  -0.8106 4214.4234 
 residual sum-of-squares: 2388

Number of iterations to convergence: 11 
Achieved convergence tolerance: 2.153e-06
于 2013-08-21T18:06:22.660 回答
5

请检查 minpack.lm 包中的 nlsLM 函数。这是一个更强大的 nls 版本,可以处理残差平方和为零的数据。

https://www.r-bloggers.com/a-better-nls/

于 2017-05-05T22:12:31.633 回答