问题标签 [glm]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
895 浏览

r - 在 R 中加速大量 GLM

首先,对不起,很长的帖子。认为最好提供上下文以获得好的答案(我希望!)。前段时间我写了一个 R 函数,它将获取数据框中变量的所有成对交互。这在当时工作得很好,但现在一位同事希望我用更大的数据集来做这件事。他们不知道最终会有多少变量,但他们猜测大约有 2,500 - 3,000 个。我下面的函数太慢了(100 个变量需要 4 分钟)。在这篇文章的底部,我列出了各种变量数量和交互总数的一些时间安排。我有在我的函数运行的 100 个变量上调用 Rprof() 的结果,所以如果有人想看看它,请告诉我。我不想让超长的时间超过它需要的时间。

我想知道的是我是否可以做些什么来加快这个功能。我尝试直接查看 glm.fit,但据我了解,为了有用,设计矩阵的计算以及坦率地说我不理解的所有其他东西,每个模型都需要相同,我的分析并非如此,尽管我对此可能错了。

任何有关如何使此运行更快的想法将不胜感激。我计划最终使用并行化来运行分析,但我不知道我可以访问多少个 CPU,但我会说不会超过 8 个。

在此先感谢,干杯
戴维。

下表是通过函数传递的变量数量增加的 system.time 结果。n 是数量,Ints 是由该数量的变量给出的成​​对交互的数量。

如果您想查看时序或 Rprof() 结果,请使用一些代码来重现数据帧。请不要运行此程序,除非您的机器速度非常快,或者您准备等待大约 15-20 分钟。

0 投票
2 回答
11202 浏览

r - 使用 glm() 内 splines 包中的 ns() 函数

我正在尝试将splinesns()包中的函数与我用来测试颗粒物浓度 ( ) 对健康结果 ( ) 的显着性的泊松 GLM 一起使用:pm.lag0Freq

我得到了这些错误:

这不是有效的使用ns()吗?有人可以帮我解码此错误消息吗?R 提供的样条曲线文档似乎与此错误不匹配(?ns)。

0 投票
3 回答
1268 浏览

r - 在 R 中绘制 GLM 拟合的轮廓偏差

我希望能够绘制使用glm()R 中的函数拟合的参数估计的轮廓偏差。轮廓偏差是在估计所有其他参数之后,所讨论的参数估计的不同值的偏差函数。我需要围绕拟合参数绘制几个值的偏差,以检查二次偏差函数的假设。

我的模型是预测罪犯的再定罪。该公式的形式为: reconv ~ [other variables] + sex,其中reconv是二进制是/否因子,并且sex是二进制男性/女性因子。我想绘制为 sex=female 估计的参数的轮廓偏差(sex=male 是参考水平)。

glm()函数将参数估计为 -0.22,标准误差为 0.12。

[我问这个问题是因为我找不到答案,但我解决了问题,并想发布一个对其他人有用的解决方案。当然,欢迎提供额外的帮助。:-)]

0 投票
1 回答
6160 浏览

sas - 如何在 SAS 中进行 1-way RM ANOVA 后进行 Tukey 的 HSD 事后测试?

我运行以下几行:

但是该MEANS语句适用于类变量(“错误:此效果中只允许类变量。” SAS 说。)。反过来,我只定义了响应(试验)MODEL AA BB CC DD EE = / NOUNI;:。有谁能够帮我?

PS
(基本上我的设计在CrossValidated中进行了解释。)

0 投票
0 回答
709 浏览

sas - Proc GLM ODS 编号格式

您如何格式化 SAS 中 Proc GLM 中 ODS 的参数估计值?我的代码是

我想将 beta 至少写到第四位有效数字,但如果 beta_x1 是 int,并且 beta_x2 绝对小于 1,则输出会将 beta_x2 四舍五入到最接近的数字。有什么建议么?提前致谢。

0 投票
3 回答
3769 浏览

r - R:在 R 函数中将参数传递给 glm

我正在尝试习惯 R 中的范围问题。我想在函数中调用该函数glm(),但它不起作用,显然是出于范围界定的原因,我没有设法用函数assign()eval().

这是一个简化版本:

现在我想在我的数据集上使用函数 ao()

这不起作用,但以下工作:

有谁知道该怎么做?

任何帮助将不胜感激 !!!

顺便说一句,这里是如何用我正在使用的数据集复制我的问题

0 投票
1 回答
844 浏览

quaternions - 四元数反转向量

我正在使用 glm::quaternions 围绕某个轴旋转矢量。但是向量在每次调用时都会反转轴。

这是我围绕侧轴旋转对象的代码:

每次调用此方法时,我的向上向量都会绕轴旋转,但也会反转。我可以通过使用来解决这个问题:

但这更像是治标不治本。也许这里有人可以帮助我理解四元数在这里的作用。

0 投票
1 回答
1004 浏览

python - 使用rpy2时glm计算慢

我想使用 R 的 glm 包计算逻辑回归参数。我正在使用 python 并为此使用 rpy2。出于某种原因,当我使用 RI 运行 glm 函数时,得到的结果比使用 rpy2 快得多。你知道为什么使用 rpy2 的计算要慢得多吗?我正在使用 R - V2.13.1 和 rpy2 - V2.0.8 这是我正在使用的代码:

0 投票
1 回答
8857 浏览

r - 在 R 中解释 glmnet 中的系数名称

我正在使用 glmnet 使用以下代码根据一组 5 个功能预测概率。我需要实际的公式,因为我需要在不同的(非 R)程序中使用它。

结果系数的名称有五个位置(我假设这是每个特征之一),每个位置都是 0 到 3 之间的数字(我假设这是多项式的次数)。但是我仍然对如何准确地重构公式感到困惑。

以这些为例:

我们将特征称为 A、B、C、D、E。这应该如何解释公式?

如果这不正确,我应该如何解释它?

我看到了以下问题和答案,但它没有解决这些类型的系数名称。

在此先感谢您的帮助。

0 投票
2 回答
1128 浏览

r - 使用glmulti拟合准家庭?

我使用包中的glmulti函数glmulti来获得泊松误差分布数据的最佳 glm 模型。那里没有问题。一旦我获得了最佳模型,我就使用卡方检验来获得 p 值并测试输入到模型中的每个变量的统计数据。我遇到的唯一问题是数据过度分散,Zuur book 和 Crawley 都建议使用准族函数来纠正过度分散。这本身不是问题,只是 glmulti 函数不允许拟合准函数。

我的问题是,使用具有泊松误差分布的 glmulti 获得我的最佳模型,然后将最佳模型输出拟合到准函数是否是做事的不正确方法,以及是否有任何其他人可以提供的建议。

我还为正态分布的数据运行了 glmulti(将家庭指定为高斯,将链接指定为身份),这确实有效,但如果我违反了任何主要规则,请告诉我。