问题标签 [lm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R中的xts回归
是否有使用以下类型的 xts 对象运行回归的实用程序:
wheremy_xts
是一个xts
包含 anx
和 a的对象y
。问题的关键是有没有办法避免做一堆滞后和合并以拥有data.frame
所有滞后?我认为该软件包dyn
适用于zoo
对象,因此我希望它以相同的方式工作,xts
但可能会有一些更新。
r - 在 `NA` 值的情况下,将来自`lm()` 的拟合值与数据框匹配
这一定是一个非常微不足道的问题,但我正在努力寻找解决方案。这是我的问题:
这行得通
这(当然)不起作用
但是我如何让第二个例子起作用呢?row.names
我通过in尝试了一个解决方案,model.matrix()
但是当我在回归中包含某些因素时这不起作用(如果我理解正确,这已被报告为错误)。谢谢你的热心帮助!
r - 如何从线性模型 (lm) 预测 x 值
我有这个数据集:
我使用以下方法计算了一个线性模型lm()
:
x
我想知道如果我有新值的预测值y
,例如ynew <- c(5.5, 4.5, 3.5)
,但是如果我使用该predict()
函数,它只会计算新y
值。
x
如果我有新值,我如何预测新y
值?
r - 线性最小二乘拟合
东风
DF2
DF 是一个更大的数据框的示例,它实际上具有数百个“a”、“b”和“s”值的组合,这些组合会产生不同的“ex”值。我想要做的是找到“a”、“b”和“s”的组合,其“ex”值(DF)在等效“时间”最适合“平均值”(DF2)。该拟合将一次比较 8 个值(即,times == c(0,20,40,60,120,180,240,360)。
在此示例中,我希望 59、140 和 1e-4 用于“a”、“b”和“s”值,因为这些“ex”值 (DF) 最适合“平均值”值 (DF2) .
我想要那些“ex”(DF)最适合“mean”(DF2)的值的“a”、“b”和“s”值
因为我想要“a”、“b”和“s”值的一种可能组合,所以最好使用线性最小二乘拟合模型。我将一次比较 8 个值——其中 'times' == 0 - 360。我不希望 'a'、'b' 和 's' 值最适合每个单独的时间点。我想要所有 8 个“ex”(DF)最适合所有 8 个“平均”值(DF2)的“a”、“b”和“s”值,这就是我需要帮助的地方。
我从未使用过线性最小二乘拟合,但我认为我正在尝试做的事情是可能的。
r - 在 R 中使用 lmer() 正确格式化混合模型设计
我正在尝试使用lmer()
. 下面的三个模型都试图实现相同的目标——一个简单的固定效应模型——所以两个肯定是错的。
在模型中,shoppers
是商业中心的消费者支出数据。有一个一般的平方反比距离关系描述了消费者是如何从中心分布的。这反映在一个gravity
模型中,该矩阵将较近的区域加权高于较远的区域,以模拟距离的影响。 Population
还给出了住宅区的大小。我认为这r3
应该是正确的格式,但它产生的 AIC 分数高于r2
. 知道为什么会这样,哪个是正确的?
提前谢谢了!
r - 如何手动设置线性模型中变量的系数?
在 R 中,如何设置特定变量的权重而不是函数中的观察lm()
值?
上下文如下。我正在尝试为特定产品(例如手机)建立个人排名系统。我可以基于价格作为因变量和其他特征(如屏幕尺寸、内存、操作系统等)作为自变量来构建线性模型。然后我可以用它来预测手机的实际成本(而不是声明的价格),从而找到最佳的价格/质量系数。这是我已经做过的。
现在我想“突出”一些只对我很重要的功能。例如,我可能需要一个大内存的手机,因此我想给它更高的权重,以便线性模型针对内存变量进行优化。
lm()
R中的函数有weights
参数,但这些是观察的权重而不是变量(如果这是错误的,请纠正我)。我也尝试过使用公式,但只得到解释器错误。有没有办法将变量的权重合并到 中lm()
?
当然,lm()
功能并不是唯一的选择。如果您知道如何使用其他类似的解决方案(例如glm()
),这也很好。
UPD。经过几次评论后,我明白我思考问题的方式是错误的。通过调用获得的线性模型lm()
为训练示例提供了最佳系数,并且没有办法(也不需要)改变变量的权重,很抱歉我造成了混淆。我实际上正在寻找的是更改现有线性模型中的系数以手动使某些参数比其他参数更重要的方法。继续前面的例子,假设我们有以下价格公式:
该公式描述了价格和电话参数之间相关性的最佳可能线性模型。但是,现在我想手动将memory
变量前面的数字 30 更改为 60,所以它变成:
当然,这个公式不再反映价格和手机参数之间的最佳关系。此外,因变量没有显示实际价格,只是一些善值,考虑到记忆对我来说比普通人重要两倍(基于第一个公式的系数)。但是这种善良的价值(或者,更准确地说,分数的价值goodness/price
)正是我所需要的——拥有这个我可以找到最好的(在我看来)价格最优惠的手机。
希望所有这些都有意义。现在我有一个(可能非常简单)的问题。如何在现有的线性模型中手动设置系数,获得的lm()
?也就是说,我正在寻找类似的东西:
这段代码当然不起作用,但你应该明白。注意:显然可以将memory
数据框中的列中的值加倍,但我正在寻找更优雅的解决方案,影响模型,而不是数据。
r - lm() 线性模型 - 属性
所以我对 lm() 命令有点困惑。我试过了lm(x~y, mydata)
,lm(y~x, mydata)
我得到了不同的输出。那么这只是将哪个变量用作 x 以及将哪个变量用作 y 吗?很抱歉问这样一个菜鸟问题,但我不确定,我找不到任何解释该命令参数的东西!
r - 在 R 中使用 lm() 进行一系列独立拟合
我想lm()
在 R 中使用来拟合一系列(实际上是 93 个)单独的线性回归。根据 Rlm()
帮助手册:
“如果响应是矩阵,则线性模型通过最小二乘法分别拟合到矩阵的每一列。”
只要 Y 响应矩阵中没有丢失的数据点,此方法就可以正常工作。当存在缺失点时,不是用可用数据拟合每个回归,而是丢弃在任何列中具有缺失数据点的每一行。有没有办法指定lm()
应该独立地适合 Y 中的所有列,而不是丢弃单个列缺少数据点的行?
r - 如何从 R 中的 lm 命令中提取表格摘要数据
我的数据结构如下:
大约有 300 个组,每个组有 70 个左右的连续数据元素。
我发布了以下脚本来估计每个组的二阶多项式。
对于这些新变量中的每一个,我都可以发布一个摘要声明来揭示有趣的信息:
出于我的目的,我需要将此信息转录成表格,从这种格式剪切和粘贴非常繁琐且耗时:
使用传统记数法而不是科学记数法对我来说也很方便,但我想我可以没有它。
我有什么办法可以做到这一点而无需手动剪切和粘贴?
谢谢--sw
r - 使用 predict 查找非线性模型的值
我正在尝试下一个代码来尝试查看 predict 是否可以帮助我找到 2 阶多项式的因变量的值,在这种情况下很明显 y=x^2:
如果我试图找到 x=7 的值,我会得到:
我究竟做错了什么?