可能重复:
构建模型时需要许多变量的简短公式
我有一个包含 22,000 行和 2,000 列的数据框。列是样本,行是基因。
在这 22,000 个基因中,有 1,000 个是预测/独立变量。其余 21,000 个基因是响应/因变量。
我想编写一个模型,其中所有 1,000 个自变量预测因变量的结果,因此每个因变量的模型看起来像这样:
y ~ x1 + x2 + x3 + ... + x1000
我知道在 R 中编写多元回归模型的方式是这样的:
example <- lm( y ~ x1 + x2 + x3, data=test)
现在,数据框的所有变量都在行中,但我可以轻松地转换数据集。所以我有三个问题:
如何编写上面的示例代码,这样我就可以合并所有 1000 个因变量而无需输入 x1 + ... + x1000?
是否可以编写这个方程,以便可以从数据框中提取所有 1000 个因变量作为 ROWS?如果是这样,怎么做?
我们如何自动保存来自 lm 输出的每个因变量的所有系数值?