1

假设数据集有三列

Date   Region   Price  
01-03    A        1
01-03    A        2
01-03    B        3
01-03    B        4
01-03    A        5
01-04    B        4
01-04    B        6
01-04    B        7 

我尝试通过以下代码按日期和地区获取领先价格。

data want;
set have;
by _ric date_l_;
do until (eof);
set have(firstobs=2 keep=price rename=(price=lagprice)) end=eof;
end;
if last.date_l_ then call missing(lagprice);
run;

然而,WANT 只有一个观察结果。然后我创建new_date=date并尝试另一个代码:

data want;
set have nobs=nobs;
  do _i = _n_ to nobs until (new_date ne Date);
  if eof1=0 then
  set have (firstobs=2 keep=price rename=(price=leadprice)) end=eof1;
  else leadprice=.;
  end;
run;

使用此代码,SAS 工作缓慢。所以我认为这段代码也不合适。任何人都可以提出一些建议吗?谢谢

4

2 回答 2

2

尝试按您想要引导价格的变量排序,然后设置两次:

data test;
length Date   Region  $12 Price 8 ; 
input Date  $ Region $   Price ;
datalines; 
    01-03    A        1
    01-03    A        2
    01-03    B        3
    01-03    B        4
    01-03    A        5
    01-04    B        4
    01-04    B        6
    01-04    B        7 
    ;
run;

** sort by vars you want lead price for **;
proc sort data = test;
    by DATE REGION;
run;

** set together twice -- once for lead price and once for all variables **;
data lead_price;
    set test;
    by DATE REGION;
    set test (firstobs = 2 keep = PRICE rename = (PRICE = LEAD_PRICE))
        test (obs = 1 drop = _ALL_);
    if last.DATE or last.REGION then do; 
        LEAD_PRICE = .;
    end;
run;
于 2017-06-08T13:19:20.993 回答
0

您可以使用proc expand按组生成数值变量的潜在客户。请尝试以下方法:

第 1 步:按地区、日期排序

proc sort data=have;
    by Region Date;
run;

第 2 步:创建一个新的 ID 变量来表示观察编号

因为每个区域每个日期都有多个值,所以我们需要生成一个新的 ID 变量,以便proc expand使用leadby 观察数而不是 by date

data have2;
    set have;

    _ID_ = _N_;
run;

第 3 步:使用转换proc expand按区域运行lead

lead会完全按照听起来的那样做。只要数据支持,您可以根据自己的喜好选择任意数量的值。在这种情况下,我们领先于一个观察。

proc expand data=have2
            out=want;
    by Region;
    id _ID_;
    convert Price = Lead_Price / transform=(lead 1) ;
run;
于 2017-06-08T13:14:08.487 回答