我的数据遇到了一些问题,需要一些帮助。我正在尝试使用存在/不存在变量作为响应变量和几个解释变量(时间、位置、存在/不存在数据、丰度数据)运行 glm 分析。
首先,我尝试使用 glm() 函数,但是我有 2 个关于 glm.fit () 的警告:1:glm.fit:算法没有收敛 2:glm.fit:在经过一些调查后,出现数字 0 或 1 的拟合概率我发现问题很可能是准完全分离,因此决定使用 brglm 和/或 logistf。
logistf:分析不运行运行 logistf() 时,我收到一条错误消息: chol.default(x) 中的错误:前导未成年人 39 不是肯定的 我在 Internet 上的理论和技术论文中查看了 logistf 包手册Heinze 和 Ploner 的,无法找到使用此功能的位置以及是否可以通过某些设置修复错误。
brglm:分析运行但是我收到一条警告消息:在 fit.proc(x = X, y = Y, weights = weights, start = start, etastart # = etastart, : 达到迭代限制之前我找不到位置和原因此功能在运行包时使用,如果可以通过调整一些设置来修复它。
以更一般的方式,我想知道这些包的根本区别是什么。
我希望这足够有意义,如果这是我不知道的统计证据,我很抱歉。
这是我第一次提出问题,所以如果不应该这样,我深表歉意,并请您不要犹豫,让我知道。
谢谢您的帮助
霍奇特尔 C.
这是我的表格的摘录(由于表格太宽,我不得不截断行的长度:20 列)和我运行的不同公式:
head ()
Year Quarter Subarea Latitude Longitude Presence.S CPUE.S Presence.H CPUE.H Presence.NP
1 2000 1 31F1 51.25 1.5 0 0 0 0 0
2 2000 1 31F2 51.25 2.5 0 0 0 0 0
3 2000 1 32F1 51.75 1.5 0 0 0 0 0
4 2000 1 32F2 51.75 2.5 0 0 0 0 0
5 2000 1 32F3 51.75 3.5 0 0 0 0 0
6 2000 1 33F1 52.25 1.5 0 0 0 0 0
tail ()
Year Quarter Subarea Latitude Longitude Presence.S CPUE.S Presence.H CPUE.H
4435 2012 3 50F3 60.75 3.5 1 103.000 1 110.000
4436 2012 3 51E8 61.25 -1.5 1 1311.600 1 12.000
4437 2012 3 51E9 61.25 -0.5 1 34.336 1 46.671
4438 2012 3 51F0 61.25 0.5 1 430.500 1 148.000
4439 2012 3 51F1 61.25 1.5 1 115.000 1 85.000
4440 2012 3 51F2 61.25 2.5 1 72.500 1 5.500
logistf_binomPres <- logistf (Presence.S ~ (Presence.BW + Presence.W + Presence.C + Presence.NP +Presence.P + Presence.H +CPUE.BW + CPUE.H + CPUE.P + CPUE.NP + CPUE.W + CPUE.C + Year + Quarter + Latitude + Longitude)^2, data = CPUE_table)
Brglm_binomPres <- brglm (Presence.S ~ (Presence.BW + Presence.W + Presence.C + Presence.NP +Presence.P + Presence.H +CPUE.BW + CPUE.H + CPUE.P + CPUE.NP + CPUE.W + CPUE.C + Year + Quarter + Latitude + Longitude)^2, family = binomial, data = CPUE_table)