2

我有一个看起来像这样的数据集:

    Unique_ID Date    
    1         03/23/1995
    1         03/27/1995
    1         04/14/1995
    1         08/29/1995
    1         02/14/1996
    .         .
    .         .
    .         .
    1         03/19/1997
    2         10/20/1993
    .         .
    .         .
    .         .
    2         04/20/2000

在每个 Unique_ID 中,我只需要保留从第一次观察开始的日期至少相隔 3 个月的观察(我的数据集按 Unique_ID 和日期排序)。例如,在 Unique_ID 1 内,我需要保留距 1995 年 3 月 23 日至少 90 天的下一个观测值,然后是距那一天 90 天的下一个观测值,依此类推。有人可以用宏或某种循环为我指出正确的方向吗?

4

1 回答 1

2

你可以尝试这样的事情:

data want;
   set have;
      by ID;
   retain date2find;
   if first.ID then do;
      output;   /* This statement will include the first obs from each    */
                /* set of IDs if desired.  If not, delete this statement. */
      date2find = DATE + 90;
      end;

   if DATE >= date2find then do;
      output;                /* Output the found record    */
      date2find = DATE + 90; /* Re-set to date to be found */
      end;
   drop date2find;
run;

这取决于您的数据集按描述排序(按 ID 和日期)

于 2013-02-11T18:39:32.557 回答