我正在对人口普查数据进行回归,其中我的因变量是预期寿命,我有八个自变量。数据是按城市汇总的,所以我有数千个观察结果。
不过,我的模型有些异方差。我想运行一个加权最小二乘法,其中每个观察值都由城市人口加权。在这种情况下,这意味着我想通过人口平方根的倒数对观察结果进行加权。然而,我不清楚什么是最好的语法。目前,我有:
Model=lm(…,weights=(1/population))
那是对的吗?或者应该是:
Model=lm(…,weights=(1/sqrt(population)))
(我在这里发现了这个问题:Weighted Least Squares - R但它没有阐明 R 如何解释权重参数。)