在 Stata 中是否可以(使用cem
命令)创建重叠的 bin?例如,如果我的治疗中的记录是2012 年 1 月 1 日,如果对照记录在任一方向的 2 天内DATE
,我希望匹配为“真” 。DATE
我尝试使用中间的处理日期手动编码垃圾箱,但由于我有数千个日期,这花费了太长时间。
使用上面的示例控制案例,匹配的日期可能是 2011 年 12 月 30 日;2011 年 12 月 31 日;2012 年 1 月 1 日;2012 年 1 月 2 日;或 2012 年 1 月 3 日。
你说:
如果控制记录的日期在任一方向的 2 天内,我希望匹配为“真”。
我没有检查用户编写的命令的内部工作原理cem
,但变量cem_matched
(在运行后创建cem
)表示观察是否匹配,它似乎取决于属于有
控制和治疗观察的层的观察. 如果一个层已经控制和处理了观察,它们都被认为是匹配的和cem_matched = 1
。如果不是,则该层中的所有观测值都有cem_matched = 0
。所以我不太清楚你想如何使用另一个作为参考来修改这个变量。
也许您想使用DATE
变量创建层。我不是专家,但据我所知,一个观察必须完全属于一个或另一个阶层(cem
至少这似乎是正确的)。重叠的 bin 违反了这一点。您的规则意味着观察可能位于某个切点的右侧和左侧。来自help cem
:
. cem 年龄 (10 20 30 40 50) 教育 (scott) re74, 治疗 (治疗)
会将第一个变量 age 粗化为 (0-10)、(10-20)、(20-30)、(30-40)、(40-50) 和 (50+) 的 bin。
如您所见,非重叠箱。如果有些重叠会怎样?它会将观察结果分配到左侧还是右侧?将需要一些其他标准。
在与其他混杂协变量一起运行之后,也许您想根据
DATE
变量丢弃(或标记)每个层的一些观察结果?我不确定。然而回想一下,Stata 中的变量是可以计算的。参见例如: http: //www.ats.ucla.edu/stat/stata/modules/dates.htmcem
date
注意:cem
运行时可用ssc install cem
。