我有一个大型数据集,每条记录中都有开始日期和停止日期。
我们可以将一个唯一的字段值称为 Uniq1。
每条记录都有一个 Uniq1。
其他字段可以称为 MID、PrDl、PsDl。
Uniq1, MID 是整数。
我需要做的是从此数据集中输出一个数据集(考虑 SelfJoin),该数据集已用是或否(1 或 0)标记每条记录,其中 1 = 一条记录,其停止日期之后是另一条记录的开始日期停止日期的 30 天。
这将特定于 MId,因此如果 MId 1 按时间顺序有 6 条记录,并且第二条记录是前一个记录停止日期后 30 天内的录取,则第二条记录将标记为 = 1,而初始记录将标记为 0 和在 MId 1 的 4 个后续记录中,没有其他类似的 30 天事件,因此它们也被标记为 = 0。
理想情况下,我想要以下输出,例如:
Uniq1 MId 开始停止 #Days 标志 PrDl PsDl
123 1 2010 年 1 月 24 日 2010 年 2 月 4 日 0 字符值 字符值
321 1 2/25/2010 3/5/2010 21 1 字符值 字符值
789 1 2010 年 6 月 21 日 2010 年 6 月 28 日 116 0 字符值 字符值
请注意,Uniq1-123 和 Uniq1-321 之间的天数为 21,因此标志 =1,但是,在 Uniq1-321 和 Uniq1-789 之间,天数为 116,标志 = 0。
任何建议将不胜感激,谢谢