我正在将一个 .dat 数据集输入到 sas 中,用于教学信息使用的练习。这是我到目前为止所拥有的。
DATA companies;
INFILE "/folders/myshortcuts/Stat324/BigCompanies.dat" encoding='wlatin2';
INPUT rank 3. @6 company $UTF8X25. @35 country $17. @53 sales comma6. @60 profits comma8. @70 assets comma8. @82 marketval comma6.;
RUN;
这适用于每一行,除了那些包含特殊/国际字符的行。如:
94 SociÈtÈ GÈnÈrale France $98.6B $3.3B $1,531.1B $25.8B
这些行在第一个货币值 (@53 sales comma6.) 处跳闸,并引发警告,指示为该输入找到无效数据,并分配缺失值 (.)。
玩弄@指针和通知 w 值似乎表明特殊字符正在抛弃列对齐,这可能吗(一个特殊字符实际上占用 2 位/空格,即使它打印为单个字符。有一个简单的解决方案?