0

可能重复:
构建模型时需要许多变量的简短公式

我有一个包含 22,000 行和 2,000 列的数据框。列是样本,行是基因。

在这 22,000 个基因中,有 1,000 个是预测/独立变量。其余 21,000 个基因是响应/因变量。

我想编写一个模型,其中所有 1,000 个自变量预测因变量的结果,因此每个因变量的模型看起来像这样:

y ~ x1 + x2 + x3 + ... + x1000

我知道在 R 中编写多元回归模型的方式是这样的:

example <- lm( y ~ x1 + x2 + x3, data=test)

现在,数据框的所有变量都在行中,但我可以轻松地转换数据集。所以我有三个问题:

  1. 如何编写上面的示例代码,这样我就可以合并所有 1000 个因变量而无需输入 x1 + ... + x1000?

  2. 是否可以编写这个方程,以便可以从数据框中提取所有 1000 个因变量作为 ROWS?如果是这样,怎么做?

  3. 我们如何自动保存来自 lm 输出的每个因变量的所有系数值?

4

0 回答 0