问题:我们可以使用从线性回归得出的非标准化系数来消除自变量对因变量的影响吗?
我有一个大型数据集,并怀疑(不需要的)自变量 (IV) 会影响正在研究的数百个因值 (DV)。所有变量都是比率/间隔。我需要在继续进一步分析之前消除这种影响,并希望创建一个新的、更正的估计数据集。我的想法是通过线性回归计算 IV 和每个 DV 之间的回归系数。因此,如果 IV (X) 对 DV (Y) 的影响显着,我将计算一个新的估计 Y,将回归系数乘以 IV 值减去新数据集的校正估计 Y 值.
Y^new = Y^old - bX
Y = dependent variable
X = independent variable
b = unstandardized regression coefficient
这种方法合适吗?不显着相关的 IV-DV 该怎么办?