match - Stata中可以在cem中使用的bin

Question

在 Stata 中是否可以（使用cem命令）创建重叠的 bin？例如，如果我的治疗中的记录是2012 年 1 月 1 日，如果对照记录在任一方向的 2 天内DATE，我希望匹配为“真” 。DATE我尝试使用中间的处理日期手动编码垃圾箱，但由于我有数千个日期，这花费了太长时间。

使用上面的示例控制案例，匹配的日期可能是 2011 年 12 月 30 日；2011 年 12 月 31 日；2012 年 1 月 1 日；2012 年 1 月 2 日；或 2012 年 1 月 3 日。

score 1 · Accepted Answer

你说：

如果控制记录的日期在任一方向的 2 天内，我希望匹配为“真”。

我没有检查用户编写的命令的内部工作原理cem，但变量cem_matched （在运行后创建cem）表示观察是否匹配，它似乎取决于属于有控制和治疗观察的层的观察. 如果一个层已经控制和处理了观察，它们都被认为是匹配的和cem_matched = 1。如果不是，则该层中的所有观测值都有cem_matched = 0。所以我不太清楚你想如何使用另一个作为参考来修改这个变量。

也许您想使用DATE变量创建层。我不是专家，但据我所知，一个观察必须完全属于一个或另一个阶层（cem至少这似乎是正确的）。重叠的 bin 违反了这一点。您的规则意味着观察可能位于某个切点的右侧和左侧。来自help cem：

. cem 年龄 (10 20 30 40 50) 教育 (scott) re74, 治疗 (治疗)

会将第一个变量 age 粗化为 (0-10)、(10-20)、(20-30)、(30-40)、(40-50) 和 (50+) 的 bin。

如您所见，非重叠箱。如果有些重叠会怎样？它会将观察结果分配到左侧还是右侧？将需要一些其他标准。

在与其他混杂协变量一起运行之后，也许您想根据 DATE变量丢弃（或标记）每个层的一些观察结果？我不确定。然而回想一下，Stata 中的变量是可以计算的。参见例如： http: //www.ats.ucla.edu/stat/stata/modules/dates.htmcemdate

注意：cem运行时可用ssc install cem。

match - Stata中可以在cem中使用的bin

1 回答 1

Related

Reference