0

在 Stata 中是否可以(使用cem命令)创建重叠的 bin?例如,如果我的治疗中的记录是2012 年 1 月 1 日,如果对照记录在任一方向的 2 天内DATE,我希望匹配为“真” 。DATE我尝试使用中间的处理日期手动编码垃圾箱,但由于我有数千个日期,这花费了太长时间。

使用上面的示例控制案例,匹配的日期可能是 2011 年 12 月 30 日;2011 年 12 月 31 日;2012 年 1 月 1 日;2012 年 1 月 2 日;或 2012 年 1 月 3 日。

4

1 回答 1

1

你说:

如果控制记录的日期在任一方向的 2 天内,我希望匹配为“真”。

我没有检查用户编写的命令的内部工作原理cem,但变量cem_matched (在运行后创建cem)表示观察是否匹配,它似乎取决于属于有 控制治疗观察的层的观察. 如果一个层已经控制处理了观察,它们都被认为是匹配的和cem_matched = 1。如果不是,则该层中的所有观测值都有cem_matched = 0。所以我不太清楚你想如何使用另一个作为参考来修改这个变量。

也许您想使用DATE变量创建层。我不是专家,但据我所知,一个观察必须完全属于一个或另一个阶层(cem至少这似乎是正确的)。重叠的 bin 违反了这一点。您的规则意味着观察可能位于某个切点的右侧和左侧。来自help cem

. cem 年龄 (10 20 30 40 50) 教育 (scott) re74, 治疗 (治疗)

会将第一个变量 age 粗化为 (0-10)、(10-20)、(20-30)、(30-40)、(40-50) 和 (50+) 的 bin。

如您所见,非重叠箱。如果有些重叠会怎样?它会将观察结果分配到左侧还是右侧?将需要一些其他标准。

在与其他混杂协变量一起运行之后,也许您想根据 DATE变量丢弃(或标记)每个层的一些观察结果?我不确定。然而回想一下,Stata 中的变量是可以计算的。参见例如: http: //www.ats.ucla.edu/stat/stata/modules/dates.htmcemdate

注意:cem运行时可用ssc install cem

于 2013-11-06T20:15:31.470 回答