2

我正在尝试编写一个 SAS 脚本,该脚本将简单地读取 SAS .sas7bdat 数据文件并以文本格式输出。我希望日期以 YYYYMMDD 格式输出。我不知道日期列的名称是什么。我的脚本目前是:

libname tmplib '~/testdatadir/';
OPTIONS MISSING='00'x;
data tmpdata;
set tmplib.testdatafile;
array flds{*} _NUMERIC_;
do i=1 to dim(flds);
  if missing(flds(i)) then flds(i)=.;
end;
array charflds{*} _CHARACTER_;
do i=1 to dim(charflds);
  if missing(charflds(i)) then charflds(i)=' ';
end;
drop i;
RUN;

PROC EXPORT
  DATA = tmpdata
  OUTFILE = 'testdataoutfile.txt'
  DBMS = TAB REPLACE;
  PUTNAME = YES;
RUN;

我想遍历所有日期字段(就像我对NUMERIC字段和CHARACTER字段所做的那样),或者为每个NUMERIC字段添加检查以测试它是否是日期(然后我可以更改格式),或者添加一个选项PROC EXPORT 表示输出日期格式。使输出文件的日期格式为 YYYYMMDD 的任何其他方法也是可以接受的。

4

2 回答 2

5

您可以使用该varfmt函数查找数值变量的格式,这可以帮助您确定它是否为日期,即其格式是否为日期格式。从技术上讲,您可能有一个日期格式不正确的日期,所以它只是显示为 16239 或其他东西,但这些很难检测到,因为它也可能只是数字 16,239。此方法将查找在数据浏览器中显示为日期的任何内容。

然后使用put和的某种组合input将其转换为 YYYYMMDD 格式。

仅使用的一个问题put是,我认为默认情况下它将返回一个字符变量,因此您要么需要创建一个新的字符变量来保存日期,要么将 YYYYMMDD 转换回 8 位数字,所以数字20120501 而不是字符串20120501

例如2,您应该注意varfmt返回给定数据集名称和变量编号的变量格式。在示例中,他们设置了一个单独vars的表,其目的是遍历所有变量。

于 2012-05-01T17:26:15.800 回答
4

我建议改为更改变量格式。在不改变变量格式的情况下,使用 put/input 可能会导致不正确的结果。例如,如果您使用 put/input 将日期更改为年份,但将变量格式保留为 date9,则日期仍将被读取为 date9(基础值将是年份)。如果您导出为 CSV,日期将不正确。

这是一个简单的宏,它将检查所有变量并隔离日期以将其格式修改为年份。您需要指定哪些日期格式可以在您的数据集中(或创建一个比宏中的更详尽的列表),并对其进行修改以生成您需要的数据格式。

%macro _toyear(dsin=,dsout=);
/* proc contents will list all variables in the dataset, with formats */
proc contents data=&dsin out=_contents noprint; 
    run;
data _contents; 
    set _contents (where=(format in: ("DATE", "MMDDYY", "MMYY"))); 
    run;

/* use proc sql to create a macro variable with a list of the date variables */
proc sql noprint;
    selet name into: datevars separated by " " from _contents;
    quit;

/* simple error checking, in case there are no date variables */
%let dsid = %sysfunc(open(_contents, is));
%let nlobs = %sysfunc(attrn(&dsid, nlobs));

/* output dataset */
data &dsout;
    set &dsin;
    %if &nlobs ne 0 %then %do; format &datevars year4.; %end;
    run;

/* clean-up */
%let rc = %sysfunc(close(&dsid));
proc datasets nolist; delete _contents;
    run;
%mend _toyear;
于 2012-10-15T12:32:37.193 回答