4

我正在尝试使用包中fitdist ()的函数fitdistrplus将我的数据适合不同的分布。假设我的数据如下所示:

x = c (1.300000, 1.220000, 1.160000, 1.300000, 1.380000, 1.240000,
1.150000, 1.180000, 1.350000, 1.290000, 1.150000, 1.240000,
1.150000, 1.120000, 1.260000, 1.120000, 1.460000, 1.310000,
1.270000, 1.260000, 1.270000, 1.180000, 1.290000, 1.120000,
1.310000, 1.120000, 1.220000, 1.160000, 1.460000, 1.410000,
1.250000, 1.200000, 1.180000, 1.830000, 1.670000, 1.130000,
1.150000, 1.170000, 1.190000, 1.380000, 1.160000, 1.120000,
1.280000, 1.180000, 1.170000, 1.410000, 1.550000, 1.170000,
1.298701, 1.123595, 1.098901, 1.123595, 1.110000, 1.420000,
1.360000, 1.290000, 1.230000, 1.270000, 1.190000, 1.180000,
1.298701, 1.136364, 1.098901, 1.123595, 1.316900, 1.281800,
1.239400, 1.216989, 1.785077, 1.250800, 1.370000)

接下来,如果我运行fitdist (x, "gamma")一切都很好,但如果我fitdist (x, "beta")改用我会收到以下错误:

Error in start.arg.default(data10, distr = distname) : 
  values must be in [0-1] to fit a beta distribution

好的,所以我不是英语母语,但据我了解,这种方法要求数据在 [0,1] 范围内,所以我使用x_scaled = (x-min(x))/max(x). 这给了我一个向量,其值在该范围内与原始向量完全相关x

由于x_scaledis of class matrix,我使用 转换为数值向量as.numeric()。然后用 拟合模型fitdist(x_scale,"beta")

这次我收到以下错误:

Error in fitdist(x_scale, "beta") : 
  the function mle failed to estimate the parameters, with the error code 100

所以在那之后我一直在做一些搜索引擎查询,但我没有发现任何有用的东西。有人知道这里出了什么问题吗?谢谢

4

1 回答 1

9

通过阅读源代码,可以发现默认的估计方法fitdistis mle,它将mledist从同一个包中调用,这将为您选择和使用的分布构造一个负对数似然,optim或者constrOptim在数值上最小化它。如果数值优化过程有任何问题,您会收到错误消息。

看起来错误是因为当x_scaled包含 0 或 1 时,在计算 beta 分布的负对数似然时会出现一些问题,所以数值优化方法会简单地崩溃。一个肮脏的技巧是 let x_scaled <- (x - min(x) + 0.001) / (max(x) - min(x) + 0.002),所以没有 0 也没有 1 in x_scaled,并且fitdist会起作用。

于 2017-06-12T20:48:52.230 回答