问题标签 [lm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 将一个或多个系数设置为特定整数
我正在使用标准 lm 模型,并希望将我的一个或多个变量的系数设置为特定整数。
例如,我希望天气和价格变量的系数分别为 647 和 15。
我正在使用带有标准公式的 lm 函数。
到目前为止,我发现的最接近的东西是 glm 中的 offset 函数,或者 systemfit 中的 restrict.rhs。
我还研究了用它们的系数集从这些变量中减去总贡献,但这不是很可扩展。
我知道设置系数的所有问题,但只是从探索的角度来看。
r - 绘制一定范围内的拟合线 R
使用 R,我想绘制两个变量之间的线性关系,但我希望拟合线仅存在于数据范围内。
例如,如果我有以下代码,我希望这条线仅存在于 1:10 的 x 和 y 值(使用默认参数,这条线超出了数据点的范围)。
r - 为什么 lm 内存不足而矩阵乘法适用于系数?
我正在尝试使用 R 进行固定效应线性回归。我的数据看起来像
然后我决定通过制作yr
一个因素来简单地做到这一点并使用lm
:
但是,这似乎内存不足。我的因子中有 20 个级别,df
有 1400 万行,大约需要 2GB 来存储,我在一台有 22GB 专用于这个过程的机器上运行它。
然后我决定尝试老式的方法:为我的每一年创建虚拟变量,方法t1
是t20
:
并简单地计算:
这运行没有问题,并且几乎立即产生答案。
我特别好奇,当我可以很好地计算系数时,lm 是什么导致内存不足?谢谢。
r - R中lm函数的详细信息
如果在 RI 中使用以下行:
R 会找到一条经过原点的回归线。
我的问题是,原点是 x=0 还是 x 值的最低值?
例如,如果我的 x 值为 1998 到 2011 年,拟合线将在 1998 年或第 0 年通过?
r - 回归分析还是方差分析?
我希望能做到最清楚。假设我有一个包含 10 个变量的数据集,其中 4 个变量代表我称为 Y 的某种现象。另外 6 个代表我称为 X 的另一种现象。
这些变量(10)中的每一个都包含 37 个单位。这些单位只是我的分析(调查)的受访者。由于所有问题均基于李克特量表,因此它们是定性变量。所有这些的比例都是从 0 到 7,但是缺少答案的地方有“-1”和“-2”值。因此,比例实际上是从 -2 到 7。
我想要做的是计算我的 Y(在这种情况下包含 4 个变量,每个变量有 37 个答案)和我的 X(包含 6 个变量和相同数量的受访者)之间的回归。我知道对于定性分析,我应该使用 Anova 而不是回归,尽管我在某处读到甚至可以进行回归。
到目前为止,我一直试图以这种方式行事:
但是正如你所看到的,虽然我不使用由 4 个变量组成的 Y 和由 6 个组成的 X,并且我也不考虑负值,但我的 R^2 得分非常低。
如果我改为使用方差分析,我会遇到这个问题:
老实说,几天前我成功使用了anova,但不幸的是我不记得如何并且我没有将命令保存在任何地方。
我想知道的是:
- 首先,我处理问题的方式错了吗?
- 您如何看待回归输出?
- 最后,我该怎么做才能制作方差分析?如果我必须这样做。
r - 为什么更改对比度类型会更改 R lm 摘要中的行标签?
使用 R (contr.treatment) 中的默认对比,线性模型对象的摘要根据级别名称给出行名称。当我将对比更改为 contr.sum 时,线性模型对象的摘要会根据编造的数字给出行名称。
对于下面的示例代码,处理对比的行名称是 xa xb xc xd xe,对于总对比,它们是 x1 x2 x3 x4 x5。
除了手动重命名行之外,有没有办法让这些行为相同?
例子:
java - R - lm 和 r 平方
我一直在处理这个网站和其他网站上的问题,我只是想确保我理解我的做法是正确的,然后我需要一些建议来分析结果。
我将 n 个二进制矩阵从 Java 导出到 R(使用 jri),然后我想针对预期的 0 向量运行 lm()。
这是将矩阵导入 R 的导出函数
那么我想执行 lm() 函数来获取 r 平方值
我知道此时我需要使用 summary(fm) 来获取 r 平方值,但我不确定如何将它们拉出来或它们在这一点上的含义。我想知道每列与预期 0 值的偏差的重要性。
谢谢!
r - R中线性模型的系数和摘要的不同NA动作
在 R 中,当使用 时lm()
,如果我na.action = na.pass
在对 的调用中设置lm()
,那么在汇总表中,对于任何无法估计的系数都有一个 NA(因为在这种情况下缺少单元格)。
但是,如果我使用summary(myModel)$coefficients
或仅从汇总对象中提取系数coef(summary(myModel))
,则省略 NA。
我希望在提取系数时包含 NA,就像在打印摘要时包含它们一样。有没有办法做到这一点?
设置options(na.action = na.pass)
似乎没有帮助。
这是一个例子:
r - 回归结果:默认显示格式
我正在使用 lm() 函数在 R 中运行回归,但无法以简单格式显示结果。我需要打印一个 p 值向量:
如何覆盖科学记数法并获得合理的精度?我尝试了选项(scipen = 1000),但它显示无穷无尽的数字行,不知何故选项(数字= 7)在这里不起作用。
我知道我可以使用格式和冲刺之类的东西,但我想为所有数字输出设置默认显示规则,例如不超过 6 个小数。
r - lm 拟合 data.frame 的多个子集
我正在运行一些模拟,我想将线性模型拟合到我的数据子集:
这行得通,但我想使用一种更简单的方法,首先为适合的数据创建一个新的 data.frame,
适合所有情况,
(这... | id
显然是无效的语法)
并立即对完整数据使用预测,
有没有lm()
像这样使用的技巧?还是更好的解决方案?谢谢。