问题标签 [lm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R线性回归问题:lm.fit(x,y,offset = offset,singular.ok =singular.ok,...)
我尝试使用 R 进行回归。我有以下代码在导入 CSV 文件时没有问题
但是,当我尝试回归时,它不起作用。我收到一条错误消息:
我所有的 CSV 文件都是数字,如果“单元格”为空,我有“NA”值。有些列不是空的,而其他一些行有时是空的,带有 NA 值......
所以,我不明白为什么我会收到一条错误消息,即使是:
PS:CSV 数据可在: http: //pastebin.com/EWsLjKNN
r - R 中的 Predict.lm 无法识别新数据
我正在运行线性回归,其中预测变量按另一个值分类,并且无法为新数据生成建模响应。
首先,我为预测变量和误差项生成一些随机值。然后我构建响应。请注意,预测变量的系数取决于分类变量的值。我根据预测变量及其类别组成了一个设计矩阵。
警告是:
'newdata' 有 5 行,但发现的变量有 10 行
除非我错了,否则我不应该对变量名有任何问题。(在这个板上有一个或两个讨论暗示了这个问题。)请注意,第一个预测运行良好,但第二个没有。唯一的变化是第二个预测只使用了设计矩阵的前五行。
想法?
r - 如何知道在 R 中的预测方法中使用哪些 x 值?
我已经拟合了一个线性模型:
从那我使用了预测方法
但是 predict 方法并没有提供预期的结果。在下图中,我将拟合范围标记为红色。
蓝色是预测值
但预测值并非从预期点开始。我曾期望预测点的第一个 y 值从与第一个拟合值相同的点开始。
所以现在我知道为什么这不会发生。因为我从已知的 x 值预测了未知的 y 值。但是我怎样才能轻松实现蓝线向下移动,以便您可以看到蓝线与红线相关联?因此,我如何知道要使用哪些 x 值?
r - 什么是衡量数据*居中*到 LM 预测线的程度
我有两个数据集,我使用 R 的lm
命令对其进行绘图。下面的第一个图没有以红线为中心。但是右边的第二张图以直线为中心。
我的问题是:
- 衡量数据以线为中心的程度如何?
- 如何从数据结构中提取它?
我用来绘制该数据的代码很简单:
使用 RMSE 分数更新绘图:
根据以预测线为中心的数据,我正在寻找一个显示右图优于左图的分数。
r - 总结中的 p 值与 R lm() 中的方差分析之间的差异
根据我访问它的方式,我看到 anova 的 p 值存在差异。
有没有办法获得与摘要返回的值相同的值?
一个易于表示的案例在摘要和方差分析中返回 < 2.2e-16,但当我直接访问该值时给我 8.129959e-100:
在另一个更难以表示的情况下(有更多数据)我得到 p-value: < 2.2e-16 in the summary but 0 from anova.
有什么方法可以获取摘要和方差分析中返回的实际值?
我非常感谢您的帮助-
r - 滚动回归返回多个对象
我正在尝试基于此处的示例构建滚动回归函数,但除了返回预测值之外,我还想返回一些滚动模型诊断(即系数、t 值和 mabye R^2)。我希望根据结果类型以离散对象的形式返回结果。上面链接中提供的示例成功地创建了滚动预测,但我需要一些帮助打包和写出滚动模型诊断:
最后,我希望该函数返回三 (3) 个对象:
- 预测
- 系数
- T 值
- R^2
下面是代码:
因此,在弄清楚如何从模型(即 mod)中提取 t 值之后,我需要做什么才能使函数返回三 (3) 个单独的对象(即预测、系数和 T 值)?
我对 R 相当陌生,对功能真的很陌生,对动物园也很陌生,我被困住了。
任何帮助将不胜感激。
r - 如何用变量调用 lm?
给定以下功能:
以下调用失败:
因为lm
显然搜索列x
而y
不是用它们的内容替换变量名)。我该如何纠正这个问题?
我尝试使用表达式和substitute
,但无济于事。不幸的是,我不完全了解 R 如何处理这些对象以及在哪些上下文中评估表达式,因此我盲目地飞行。这是我尝试过的(不工作):
检查时,该exp
对象实际上看起来很有希望;不幸的是,我无法说服lm
吞下它。
r - R: lm() 与因子。不明白 ANOVA 表是如何计算“Sum Sq”的
我正在学习 R 并试图了解如何lm()
处理因子变量以及如何理解 ANOVA 表。我对统计很陌生,所以请对我温柔一点。
这是烂番茄的一些电影数据。我试图根据 4 组中所有电影的平均分数来模拟每部电影的分数:那些被评为 G、PG、PG-13 和 R 的电影。
和方差分析输出:
我了解如何获取此表中的所有数字Sum Sq
,Mean Sq
除了as.factor(movies$rating)
. 有人可以解释一下这Sum Sq
是如何从我的数据中计算出来的吗?我知道那Mean Sq
只是Sum Sq
除以Df
。
r - 估计替换 NA 的值
我有一个由多个时间序列组成的数据集,我想计算这些时间序列内的估计值以替换 NA 值。我对 ddply() 和 lm() 很熟悉,但我对这个有点麻烦....
这是一个数据帧中的前 5 个站点
开始...
我需要删除数据少于 7 年的任何位置,整个数据集有几百个位置......
然后
用正确的每月位置平均值替换任何 NA
我正在尝试计算各个电台的月平均值并将它们与该电台月相关联
我被困在这里...
任何帮助是极大的赞赏...
太感谢了。杰西
r - lm(y~x*g) 忽略 g 的一个值
我第一次尝试使用 R。
在这种情况下,y
是耗氧量,x
是时间,g 是由最多三个字母(NYF、IR、F、M 或 NF)指示的状态。它将针对除 F 之外的每个状态运行回归。
[旁注:我还尝试使用子集函数通过多次回归来完成此操作。当我使用
它实际上并不遵循子集,并且无论我输入哪种状态,都可以为整个数据集提供回归。
如何根据status
列中的代码从单个数据集中获得多个简单的线性回归?