问题标签 [glm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - Cedergren 数据集在 ubuntu 中下载
有没有人在 Ubuntu 中使用过 cedergren 数据集。我有问题,因为我有 Ubuntu 操作系统。它基本上用于逻辑回归
http://nlp.stanford.edu/~manning/courses/ling289/cedegren-varbrul.html
将使用 glm 函数来查看它是如何在这个数据集上工作的
任何帮助表示赞赏!
r - 使用分类响应变量在 R 中调用“glm”
我正在尝试使用以下数据与响应变量y1
作为分类来拟合 glm。该代码给了我以下警告消息:
有时,它确实给了我错误
从数据可以看出,预测变量和响应变量之间存在明显的关系。
是因为数据点数量较少而导致“未收敛”错误吗?
glm
正在将响应变量转换为因子,如下所示。这是正常的吗?有一个
/li>x1
和x2
值,我怎么知道响应?
r - 执行 glm 时,“性别”变量以 value(M) 为后缀
当我在 R 中运行“glm”时,“性别”变量以 M 为后缀(代表男性)。它有什么特殊含义还是我的代码有问题
r - 逻辑回归预测的置信区间
在 R 中,predict.lm 根据线性回归的结果计算预测,并提供计算这些预测的置信区间。根据手册,这些区间是基于拟合的误差方差,而不是基于系数的误差区间。
另一方面,基于逻辑和泊松回归(以及其他一些回归)计算预测的 predict.glm 没有置信区间的选项。我什至很难想象如何计算这样的置信区间来为泊松和逻辑回归提供有意义的见解。
是否存在为此类预测提供置信区间有意义的情况?如何解释它们?在这些情况下的假设是什么?
r - for循环中的多个glm
我有一个 R 数据框,强烈简化为:
与id
作为我的主题(实际上我有很多超过 2),correct
= 编码为不正确(0)或正确(1)的响应,以及phases
歧视和逆转(主题内因素)。
我想以以下形式执行逻辑回归
稍后可能会添加其他预测变量。但是,由于我对每个主题都有不同数量的数据,我想glm()
对每个主题分别执行,然后将系数与 ANOVA 进行组效应比较。我想以 for 循环的形式执行此操作
但不断收到错误消息
我检查了我的数据,没有一个因子只包含一个级别。所有受试者都给出了至少一个错误和一个正确的答案,并且都参与了辨别和逆转。当我指定特定主题时,该函数在循环之外工作。
r - 当一组参数被粘贴()作为向量时,如何在glm模型的R中获得真实的残余偏差和自由度
我正在编写一个脚本(在 python 中,R 部分在 pypeR 中),因此我需要在 R 中使用一个函数来比较两个模型和 F 比测试。
模型是这样的:
模型 1: Response ~ Predictor A + Predictor B + Predictor C.... + Predictor n
模型 2: Response ~ Predictor 1
预测变量一起A+B+...n
组成Predictor 1
,所以在这里嵌套没有问题(相信我)。
当我传递Predictor A + Predictor B + Predictor C.... + Predictor n
给我创建的函数时,我认为它将它们视为一个变量(因为自由度与 的自由度相同Model 2
)。也许这是因为我正在使用paste()
?无论如何,模型 1 中预测变量的实际数量将在运行期间发生变化(这就是我需要它作为函数的原因),所以我不确定除了使用paste()
.
请记住,粘贴实际上可能不是这里的问题;我只是想让人们知道我认为可能是问题所在。
对于我如何获得真正的残余偏差和自由度有什么建议model 1
吗?这可能是一个黑客。例如,我只是简单地减去length(vector of predictors) - 1
以获得自由度。我不知道对残留偏差的类似黑客攻击会是什么。
这是函数和示例实例化:
r - R中glmm显着相互作用的简单效果测试
我的 glmm 输出中有显着的交互,并且我知道我的参考类别(另一个交互)是什么,但是在将显着交互与参考类别进行对比时,我需要知道哪个变量是固定的。
我正在寻找一种称为“简单效果测试”(不是 Tukey)的事后测试。对于同时使用 R 和 JMP 的任何人,相同的测试在 JMP 中称为“测试切片”。
我到处找,但找不到简单效果测试的代码。有谁知道如何在 R 中使用这个测试?
这是我的 glmm (使用负二项分布)输出的示例:
我的参考类别是“FoodCategoryOther:SeasonHFHL”。例如,我从这个输出中知道“FoodCategoryFruit:SeasonLFLC”比我的参考类别要积极得多。
但是,我不知道这是因为“FoodCategoryFruit”在“SeasonLFLC”(例如)期间明显比“FoodCategoryPlantMatter”积极,还是“FoodCategoryFruit”在“SeasonLFLC”期间比“FoodCategoryFruit”明显更积极“季节HFHL”。
一个简单的效果测试将修复其中一个变量,同时测试另一个变量的效果。这是我需要解决的问题,除非有人可以告诉我类似/更好/更合适的测试。但是,请不要告诉我 Tukey,因为这个事后测试在测试另一个变量的影响时并没有修复一个变量。
r - 从 glm 拟合的 lapply 列表中提取 p 值
我正在使用 lapply 一次对一个因变量执行一个自变量的几个 glm 回归。现在我Pr(>|z|)
对每个自变量特别感兴趣。但是,我不确定如何仅Pr(>|z|)
使用 lapply 的列表进行报告。
如果我一次只运行一个模型:
coef(summary(fit))[,"Pr(>|z|)"]
或者
summary(fit)$coefficients[,4]
会工作(如此处所述),但尝试类似的东西lapply
似乎不起作用。我可以使用lapply
和glm
使用访问器方法或直接从模型调用获得 p 值吗?
r - 负二项式的一阶差分引导程序
新手在这里。我在计数数据上拟合负二项式模型,其中 Y 是事件计数,D 是治疗,X 是对数偏移:
我想引导 D=1 和 D=0 之间的第一个差异的置信区间。我已经走了这么远,但不确定这是否是正确的方法:
这是引导第一个差异的正确方法吗?