问题标签 [multiple-regression]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 在R中生成多元回归公式后计算响应变量
我采用了一个样本数据集,其中包括责任、受训人员监督和薪水,其中薪水可以从责任和受训人员值生成,我使用多元回归生成了模型公式。
它工作正常!但是当我试图从实习生的可用值和责任值中预测薪水时..它会创建一个具有多个值的数据框。
当 T=100, r=100 时,predicted_salary 应该是 500 ,但它给出的输出如下:
[ 1 ] 300 500 900 400 300 700
r - R和excel之间的mlr输出差异
我正在尝试使用最初来自 excel 的数据在 R 中执行多重回归。我使用 lm() 函数在 R 中执行回归,但是当我使用 Excel 中 Solver 加载项中的回归功能对同一组变量执行相同的回归时,我得到了截然不同的结果 - 非常不同的 R^ 2 值,以及我的自变量的不同系数。有谁知道这个问题的原因?
我将在这里澄清我的步骤:在 excel 中创建我的数据,安排在每行是一个事件,每列是一个变量的位置。将 Excel 文件的副本另存为制表符分隔的文本文件。
我已经as.numeric(x1)
在所有 x* 和 y 上运行,以检查 R 是否将每个都作为数字导入,它确实如此(返回 TRUE)。
在 excel 中,我打开求解器插件,选择“回归”,选择 y 和 x 范围,然后查看输出。我已经手动查看了 R 中的向量以确保值相同,并且我尝试对我的 excel 文件中的值进行四舍五入,以确保在将它们保存到文本文件或导入 R 时四舍五入不是问题- 它不能解决它。
任何有见识的人将不胜感激。
编辑:R输出:
Excel输出:
r - 由于 y 中的 NA 数量过多,无法在 R 中运行多元回归分析
我对 R 很陌生,正在尝试对大约 250 行的数据集运行一些单独的多元回归分析。我已经成功地在具有少量 NA 的列上完成了其中的一些操作,但是它拒绝处理具有大量 NA(48 个 NA)的列并给我错误消息“mkRespMod 中的错误(fr,REML = REMLpass ) : 'y' 中的 NA/NaN/Inf"。我正在使用的命令是
有没有办法让 R 运行分析?如果我的问题不是很具体,我很抱歉,我对 R 很陌生,甚至不太确定问题是什么,请不要咬我的头,谢谢你的帮助
r - 如何分别对男性和女性进行多元回归?
我已经运行了以下多元回归:
在我的数据中,性别包括男性(编码为 0)和女性(编码为 1)。我的结果表明,性别作为一个整体有显着影响,我现在想运行两个单独的多元回归;一种用于男性,一种用于女性。
任何人都可以提供一些帮助,帮助我将这个性别变量分成男性和女性进行多重回归吗?
r - 多重回归 - 无法分配大小为 4.7gb 的向量
首先,我想说我对 R 和编码本身一无所知。我只需要对我的学士论文进行聚集标准误差的回归,而我不能在 Excel 中这样做。我设法用聚集标准误差进行线性回归,但多元回归(即使没有集群)给了我错误信息:无法分配大小为 4.7gb 的向量。我有一个 64 位 windows7 版本在我的 PC 上运行,可用 8gb RAM。R 也考虑了那些 8gb。
> memory.limit()
[1] 8168
这是我使用的函数,错误消息 R 吐出:
正如您在函数中看到的那样,我已经尝试使用 big.memory 包,要么我做错了(很可能),要么就是没有成功。
我正在使用的数据库有 38104 个观察值,有 10 列 => 38104*10
我用于对简单回归进行聚类的函数是这样的:
然后和我一起使用:
我在这里和其他网站上查看了一些帖子。尝试了几件事,但它只是给了我同样的错误信息。同样,我真的对 R 和编码一无所知,所以我真的需要最简单的方法来做到这一点:D
graph - 在SPSS中绘制三向曲线多元回归交互的语法?
我正在尝试完成我的论文,但鉴于我不是程序员,我在弄清楚如何编写 SPSS 语法来绘制我的结果时遇到了麻烦。我有三个连续预测变量和一个连续因变量;我需要绘制线性和曲线多元回归交互结果(多个假设)。SPSS ChartBuilder 将让我绘制两个预测变量,但不是三个。我认为必须有一种方法可以更改粘贴的语法以添加我的第三个预测器……我将非常感谢您的帮助。
我的顾问要求我的折线图包含我的一个预测变量的平均值和 +/-1 SD(“外向性”;这将导致三个单独的图表 - 每个用于平均值和 +/-1 SD 的第二个预测变量“学习目标导向”;例如,弱、中等和强水平),而我的第三个预测变量是我所有图表的 X 轴,“人数”。任何帮助将不胜感激,包括如果您能指出一个可以教我命令的资源的方向,以便我可以尝试编写自己的语法(请不要推荐 SPSS 的命令语法参考;我已经看过那里) . 谢谢你。
r - 求多元回归的 R 平方
如果问题有 10 个变量
通过恰好使用两个变量,找到为您提供最大调整 R 平方值的模型。
其中 xi 和 xj 可以是 x1,x2,...,x10 之间的任何给定变量
例如,我想比较调整后的 R 平方
. . .
有没有办法使用“for loop”命令比较所有结果?
python - 蛮力是使用 Python 进行多重回归的最佳选择吗?
在线性模型 = 0 + 1 × i + 2 × j + 3 × k + 中,什么值 ,j,k ∈ [1,100] 会导致模型具有最高的 R-Squared?
数据集由 100 个自变量和 1 个因变量组成。每个变量有 50 个观测值。
我唯一的猜测是遍历三个变量的所有可能组合并比较每个组合的 R 平方。我用 Python 完成的方法是:
完成需要 4.3 分钟。我相信这种方法对于每个变量都有数千个观察值的数据集效率不高。你会建议什么方法?
谢谢你。
r - 使用多变量回归的算法的 BigO
对于更冗长的算法,确定时间复杂度(即 BigO)是一件很痛苦的事情。我的解决方案是使用参数 n 和 k 对算法的执行进行计时,并提出一个随 n 和 k 变化的函数(时间函数)。
我的数据如下所示:
我一直在使用 stats R 包中的 lm() 函数。我不知道如何解释多元回归的输出,以确定最终的 Big-O。这是我的主要问题:如何将多变量回归的输出转化为对最佳 Big-O 时间复杂度评级的最终裁决?
这是 lm() 的输出:
这是 log(y) ~ log(n) + log(k) 的输出:
这是主成分的输出,显示 n 和 k 都有助于多元模型的传播: