自学 SAS 用户在这里。
我经常使用我几乎无法控制并在几个不同用户之间共享的数据集。
我通常使用 infile 语句以 CSV 格式读取文件 + 使用 informat、format 和 input 语句块定义变量。在此过程中,我是否可以继续重命名变量——前提是所有内容都以正确的顺序重命名——或者它们是否必须与原始数据集匹配并在以后的数据步骤中重命名?
例如,数据集中的变量名称是“100% 全额支付”。我知道 SAS 变量不能以数字开头,而且我也想在一般情况下简化变量名称,所以我可以执行以下操作:
infile statement...
informat Paid $3.;
format Paid $3.;
input Paid $;
run;
或者,也许我的效率很低。我尝试在没有整个信息/格式/输入业务的情况下进行简单的 proc 导入,但我发现尝试重新定义变量类型让我更加头疼(我使用的所有数据集都有文本、美元、百分比,一般数字,日期...)。无论如何,其他提示高度赞赏 - 谢谢!
编辑
也许我应该问的问题是:有什么方法可以保留美元和百分比的 csv 格式(通过 proc 导入,这似乎将这些转换为字符)?我知道我可以在导入文件之前在 Excel 中手动将格式从美元/百分比更改为“一般”,但我更愿意避免额外的手动步骤,而且因为我确实希望将这些保留为美元和百分比。还是我最好执行 informat/format/input 来指定 csv 的数据类型,以便以我希望的方式读取变量?
注意:我无法导入 xls 或 xlsx 文件,因为我使用的是 64 位计算机和/或缺少所需的驱动程序(或两者兼有)。即使在 32 位计算机上,我也永远无法做到这一点。