问题标签 [glm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 如何“更新”在 R 中使用“glm”构建的模型
在下面的可重现代码(最后一行)中,如果我将 'Income' 替换为 'fieldToRemove','update' 功能将不起作用。我怎样才能使这个功能工作?我需要循环运行该行。
r - 绘制来自多元 GLM 与响应的每个预测变量(其他预测变量保持不变)
我可以绘制一个预测变量(来自多变量逻辑、二项式 GLM)与预测响应的关系。我这样做:
上面,drat vs vs所有其他预测变量保持不变。但是,我会为每个预测变量执行此操作,并且每次执行上述过程似乎很乏味。有没有更聪明的方法来做到这一点?我想可视化每个不同预测变量的响应,最终,也许是不同的常数。
r - 如何在 glm 中使用自定义链接功能?
我不想在glm
泊松回归中使用标准日志链接,因为我有零。考虑以下代码:
我得到错误:
错误:未找到有效的系数集:请提供起始值
我不确定这意味着什么。我认为的“身份”链接功能是什么(即它根本不转换数据)?这个错误是什么意思,我该如何解决?
r - 为泊松回归解释 glm 的输出
考虑以下:
我得到结果
从this page的解释来看, foo 的系数似乎应该是log(2)
,但事实并非如此。
更一般地说,我认为这个输出应该意味着lambda = 1.187 + .1929 * foo
lambda 是泊松分布的参数,但这似乎与数据不符。
我应该如何解释这个回归的输出?
r - 在 ldply() 中使用 summary(glm-object) 和 summarise() - 函数
如何使用 ldply()-summarise-function 中的 summary-function 来提取 p 值?
示例数据:
(预装数据框“嘌呤霉素”)
我可以用提取的结果构造这个数据框:
但我不能以同样的方式提取 p 值。我认为这会起作用,但它不会:
我怎样才能将p值提取到该数据框:)请帮忙!
r - 访问和重用模型公式 (R)
我想自动化以下过程。
- 使用 . 拟合 (lm /glm) 模型
step()
。 - 提取 (1) 的结果模型中的变量,例如 (X1+X2),如
Y~X1+X2
- 在新的 lm/glm(加上一些新变量)中重新使用 (1) 中的模型。
我了解模型公式可以使用model$call
或model$terms
从哪里访问模型公式model
,例如
但我无法正确提取它并在新模型中重新使用它,例如:
似乎需要对 model$call 进行处理,但我不确定数组的结构以及如何折叠它。谢谢。
r - R - 二元响应模型中的分离问题 - glm、brglm、logistf
我的数据遇到了一些问题,需要一些帮助。我正在尝试使用存在/不存在变量作为响应变量和几个解释变量(时间、位置、存在/不存在数据、丰度数据)运行 glm 分析。
首先,我尝试使用 glm() 函数,但是我有 2 个关于 glm.fit () 的警告:1:glm.fit:算法没有收敛 2:glm.fit:在经过一些调查后,出现数字 0 或 1 的拟合概率我发现问题很可能是准完全分离,因此决定使用 brglm 和/或 logistf。
logistf:分析不运行运行 logistf() 时,我收到一条错误消息: chol.default(x) 中的错误:前导未成年人 39 不是肯定的 我在 Internet 上的理论和技术论文中查看了 logistf 包手册Heinze 和 Ploner 的,无法找到使用此功能的位置以及是否可以通过某些设置修复错误。
brglm:分析运行但是我收到一条警告消息:在 fit.proc(x = X, y = Y, weights = weights, start = start, etastart # = etastart, : 达到迭代限制之前我找不到位置和原因此功能在运行包时使用,如果可以通过调整一些设置来修复它。
以更一般的方式,我想知道这些包的根本区别是什么。
我希望这足够有意义,如果这是我不知道的统计证据,我很抱歉。
这是我第一次提出问题,所以如果不应该这样,我深表歉意,并请您不要犹豫,让我知道。
谢谢您的帮助
霍奇特尔 C.
这是我的表格的摘录(由于表格太宽,我不得不截断行的长度:20 列)和我运行的不同公式:
r - 如何循环使用变量中的重复值?
我有一个名为的数据集bjmd
,看起来像这样(简化):
我想运行一个循环来glm
对每个不同的rte
(46001、46002、46003)进行分析。在每个rte
中,有多个year
s,它们都需要包含在glm
分析中。从每条路线的glm
测试中,我正在使用坡度并创建另一个表格,其中路线和坡度作为列。这就是我想要的样子:
这是我想出的for循环代码:
这段代码有问题,因为我的斜率不断得到 0 值:
有人可以帮忙指出我在哪里搞砸了吗?
r - 具有用户指定族的 glm 回归模型公式
背景
我正在尝试预测产品线的销售额(最后样本中的 y_test)。它在一段时间内的销售额基于另一个产品 (x_test) 的所有先前销售额以及这些先前销售额中有多少仍在使用中。但是,无法直接衡量那些仍在使用的先前销售产品的数量,因此需要推断生存曲线。
例如,如果您为特定的智能手机型号制造配件,那么配件销售至少部分取决于仍在使用的智能手机的数量。(这不是作业,顺便说一句。)
细节
我有一些时间序列数据,并希望使用glm
或类似的东西来拟合回归模型。因变量和自变量之间的关系是这样的:
其中 p 为时间段,y p为因变量,x p为自变量,c 0和 c 1为回归系数,F t为累积分布函数(如pgamma
),e p为残差。
通过前三个时间段,该函数将扩展为如下所示:
所以,我有 x p和 y p的历史数据,我想获得最小化残差的系数/参数 c 0、 c 1、 c 2和 c 3的值。
我认为解决方案是使用glm
和创建一个自定义系列,但我不知道该怎么做。 我查看了Gamma
家庭的代码,但没有走多远。我已经能够使用“手动”进行优化nlminb
,但我更喜欢由或类似功能predict
提供的简单性和实用性(即和其他) 。glm
以下是一些示例数据:
r - 模型拟合:glm vs glmmPQL
我正在拟合一个关于缺勤数据的模型,我想检查随机因素是否显着。为此,应该将 glmm 与 glm 进行比较,并使用 LR 测试检查哪个最重要,如果我理解正确的话。
但是,如果我执行 ANOVA(glm,glmm) ,我会得到偏差表的分析,并且没有比较模型的输出。
如何获得我想要的输出,从而比较两个模型?
在此先感谢,科恩