问题标签 [glm]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3874 浏览

r - 如何“更新”在 R 中使用“glm”构建的模型

在下面的可重现代码(最后一行)中,如果我将 'Income' 替换为 'fieldToRemove','update' 功能将不起作用。我怎样才能使这个功能工作?我需要循环运行该行。

0 投票
1 回答
1459 浏览

r - 绘制来自多元 GLM 与响应的每个预测变量(其他预测变量保持不变)

我可以绘制一个预测变量(来自多变量逻辑、二项式 GLM)与预测响应的关系。我这样做:

上面,drat vs vs所有其他预测变量保持不变。但是,我会为每个预测变量执行此操作,并且每次执行上述过程似乎很乏味。有没有更聪明的方法来做到这一点?我想可视化每个不同预测变量的响应,最终,也许是不同的常数。

0 投票
1 回答
4859 浏览

r - 如何在 glm 中使用自定义链接功能?

我不想在glm泊松回归中使用标准日志链接,因为我有零。考虑以下代码:

我得到错误:

错误:未找到有效的系数集:请提供起始值

我不确定这意味着什么。我认为的“身份”链接功能是什么(即它根本不转换数据)?这个错误是什么意思,我该如何解决?

0 投票
1 回答
7151 浏览

r - 为泊松回归解释 glm 的输出

考虑以下:

我得到结果

this page的解释来看, foo 的系数似乎应该是log(2),但事实并非如此。

更一般地说,我认为这个输出应该意味着lambda = 1.187 + .1929 * foolambda 是泊松分布的参数,但这似乎与数据不符。

我应该如何解释这个回归的输出?

0 投票
1 回答
1076 浏览

r - 在 ldply() 中使用 summary(glm-object) 和 summarise() - 函数

如何使用 ldply()-summarise-function 中的 summary-function 来提取 p 值?

示例数据:

(预装数据框“嘌呤霉素”)

我可以用提取的结果构造这个数据框:

但我不能以同样的方式提取 p 值。我认为这会起作用,但它不会:

我怎样才能将p值提取到该数据框:)请帮忙!

0 投票
1 回答
109 浏览

r - 访问和重用模型公式 (R)

我想自动化以下过程。

  1. 使用 . 拟合 (lm /glm) 模型step()
  2. 提取 (1) 的结果模型中的变量,例如 (X1+X2),如Y~X1+X2
  3. 在新的 lm/glm(加上一些新变量)中重新使用 (1) 中的模型。

我了解模型公式可以使用model$callmodel$terms从哪里访问模型公式model,例如

但我无法正确提取它并在新模型中重新使用它,例如:

似乎需要对 model$call 进行处理,但我不确定数组的结构以及如何折叠它。谢谢。

0 投票
1 回答
2512 浏览

r - R - 二元响应模型中的分离问题 - glm、brglm、logistf

我的数据遇到了一些问题,需要一些帮助。我正在尝试使用存在/不存在变量作为响应变量和几个解释变量(时间、位置、存在/不存在数据、丰度数据)运行 glm 分析。

首先,我尝试使用 glm() 函数,但是我有 2 个关于 glm.fit () 的警告:1:glm.fit:算法没有收敛 2:glm.fit:在经过一些调查后,出现数字 0 或 1 的拟合概率我发现问题很可能是准完全分离,因此决定使用 brglm 和/或 logistf。

  • logistf:分析不运行运行 logistf() 时,我收到一条错误消息: chol.default(x) 中的错误:前导未成年人 39 不是肯定的 我在 Internet 上的理论和技术论文中查看了 logistf 包手册Heinze 和 Ploner 的,无法找到使用此功能的位置以及是否可以通过某些设置修复错误。

  • brglm:分析运行但是我收到一条警告消息:在 fit.proc(x = X, y = Y, weights = weights, start = start, etastart # = etastart, : 达到迭代限制之前我找不到位置和原因此功能在运行包时使用,如果可以通过调整一些设置来修复它。

以更一般的方式,我想知道这些包的根本区别是什么。

我希望这足够有意义,如果这是我不知道的统计证据,我很抱歉。

这是我第一次提出问题,所以如果不应该这样,我深表歉意,并请您不要犹豫,让我知道。

谢谢您的帮助

霍奇特尔 C.


这是我的表格的摘录(由于表格太宽,我不得不截断行的长度:20 列)和我运行的不同公式:

0 投票
1 回答
105 浏览

r - 如何循环使用变量中的重复值?

我有一个名为的数据集bjmd,看起来像这样(简化):

我想运行一个循环来glm对每个不同的rte(46001、46002、46003)进行分析。在每个rte中,有多个years,它们都需要包含在glm分析中。从每条路线的glm测试中,我正在使用坡度并创建另一个表格,其中路线和坡度作为列。这就是我想要的样子:

这是我想出的for循环代码:

这段代码有问题,因为我的斜率不断得到 0 值:

有人可以帮忙指出我在哪里搞砸了吗?

0 投票
1 回答
674 浏览

r - 具有用户指定族的 glm 回归模型公式

背景

我正在尝试预测产品线的销售额(最后样本中的 y_test)。它在一段时间内的销售额基于另一个产品 (x_test) 的所有先前销售额以及这些先前销售额中有多少仍在使用中。但是,无法直接衡量那些仍在使用的先前销售产品的数量,因此需要推断生存曲线。

例如,如果您为特定的智能手机型号制造配件,那么配件销售至少部分取决于仍在使用的智能手机的数量。(这不是作业,顺便说一句。)

细节

我有一些时间序列数据,并希望使用glm或类似的东西来拟合回归模型。因变量和自变量之间的关系是这样的: 回归公式

其中 p 为时间段,y p为因变量,x p为自变量,c 0和 c 1为回归系数,F t为累积分布函数(如pgamma),e p为残差。

通过前三个时间段,该函数将扩展为如下所示:

所以,我有 x p和 y p的历史数据,我想获得最小化残差的系数/参数 c 0、 c 1、 c 2和 c 3的值。

我认为解决方案是使用glm和创建一个自定义系列,但我不知道该怎么做。 我查看了Gamma家庭的代码,但没有走多远。我已经能够使用“手动”进行优化nlminb,但我更喜欢由或类似功能predict提供的简单性和实用性(即和其他) 。glm

以下是一些示例数据:

0 投票
2 回答
3490 浏览

r - 模型拟合:glm vs glmmPQL

我正在拟合一个关于缺勤数据的模型,我想检查随机因素是否显着。为此,应该将 glmm 与 glm 进行比较,并使用 LR 测试检查哪个最重要,如果我理解正确的话。

但是,如果我执行 ANOVA(glm,glmm) ,我会得到偏差表的分析,并且没有比较模型的输出。

如何获得我想要的输出,从而比较两个模型?

在此先感谢,科恩