1

我正在尝试将相关矩阵转换为一个长列向量,以便我具有以下结构

data want;
input _name1_$ _name2_$ _corr_;
datalines;
var1 var2 0.54
;
run;

我有以下代码,它输出name1和 corr; 但是,我正在努力获得name2

DATA TEMP_1
    (DROP=I J);
    ARRAY VAR[*] VAR1-VAR10;
    DO I = 1 TO 10;
        DO J = 1 TO 10;
            VAR(J) = RANUNI(0);
        END;
        OUTPUT;
    END;
RUN;

PROC CORR
    DATA=TEMP_1
    OUT=TEMP_CORR
        (WHERE=(_NAME_ NE " ")
         DROP=_TYPE_)
    ;
RUN;

PROC SORT DATA=TEMP_CORR; BY _NAME_; RUN;

PROC TRANSPOSE
    DATA=TEMP_CORR
    OUT=TEMP_CORR_T
    ;
    BY _NAME_;
RUN;

帮助表示赞赏

4

2 回答 2

3

只是一个带有 VNAME() 函数的数组。要仅输出上三角,请将 DO 循环的下限设置为 _N_。

data want ;
  length _name1_ _name2_ $32 _corr_ 8 ;
  keep _name1_ _name2_ _corr_;
  set corr;
  where _type_ = 'CORR';
  array x _numeric_;
  _name1_=_name_;
  do i=_n_ to dim(x);
    _name2_ = vname(x(i));
    _corr_ = x(i);
    output;
  end;
run;
于 2018-11-28T18:54:54.010 回答
3

你很近。您在name变量上遇到了一个奇怪的问题,因为它也变成了 PROC TRANSPOSE 之外的变量。如果你重命名它,你会得到你想要的。我还明确列出了变量并添加了一些重命名数据集选项以获得您可能想要的内容。

PROC TRANSPOSE
DATA=TEMP_CORR (rename=_name_ = Name1)
OUT=TEMP_CORR_T (rename = (_name_ = Name2 col1=corr))
;
by name1;
var var1-var10;
RUN;

编辑:如果您不想重复,可以将 WHERE 添加到 OUT 数据集。

PROC TRANSPOSE
DATA=TEMP_CORR (rename=_name_ = Name1)
OUT=TEMP_CORR_T (rename = (_name_ = Name2 col1=corr) where = name1 > name2)
;
by name1;
var var1-var10;
RUN;
于 2018-11-28T18:24:32.797 回答