4

我有一个面板数据集,其中每两年从 2004 年到 2010 年跟踪医院。数据在 Stata 中,但我将其带到 R 中。最初变量year(2004, 2006, 2008, 2010) 和t(1=2004, 2=2006 等) 是整数,但后来我将它们转换为如下因子:

data$year <- factor(data$year)

同样对于 t 时间变量也是如此。

但是我很困惑,我的问题是是否将其作为整数yeart数字变量或将其转换为面板数据的因子,以及上述命令是否是转换为因子的正确方法?

4

1 回答 1

3

year其视为分类变量将计算每个单独年份的影响 - 即在给定年份平均对目标变量的影响。另一方面,包括t数字变量表示平均两年后会发生什么。鉴于只有 4 个时间段,第一种方法似乎更合理,但这实际上取决于我们分析的目标。

命令应该是

data$year <- as.factor(data$year).

此外,请确保您仅包含其中一个yeart两者都包含可能会搞砸解释。

于 2014-10-27T10:08:19.237 回答