0

我正在尝试从二元变量列表中预测具有统计意义的变量。我对下面提到的两种查找相关变量的方法存在概念上的疑问。

因变量: 人的身高

自变量:

  1. 性别(男或女)
  2. 财务状况(贫困线以下与否)
  3. College_Graduate(是或否)

方法 1:拟合线性回归,同时将这些作为因/独立变量并找到具有统计意义的变量

方法 2:对每个因变量执行单独的统计检验(t 检验或其他相关检验)以计算统计显着变量

这两种方法是否相似并且会给出相似的结果?如果不是,具体有什么区别?

4

1 回答 1

0

由于您有多个自变量,因此显然没有。

如果您想对不同自变量(Gender、Financial_Status 和 College_Graduate)的每个值采用最测试方法,那么这意味着您将执行 3 种不同的测试。就假阳性结果而言,执行多项测试是有风险的,因此应使用多重比较调整方法(Bonferoni、FDR 等)进行调整。

另一方面,如果您将使用单个多元线性回归,您将无法正确进行多重比较,这就是为什么在我看来,这是更好的方法。

于 2019-05-22T12:44:37.910 回答