我有一个 csv 文件,其中一小部分是
Optimal
value 7.35-7.45 4.5-8 5.6-7.9 0
ID V1 V2 V3 V4
1 7.1 5.5 7.6 218
10 7.8 4.8 6.3 407
50 7.12 5.2 5.4 140
(出于保密原因,数据已更改)
总共有 125 个科目和大约 50 个变量
我需要为每个变量创建值和范围之间距离的绝对值。因此,例如对于 ID 1:
V1dist = abs(7.1 - 7.35) = .25
V2dist = 0 because 4.5 < 5.5 < 8
V3dist = 0 because 5.6 < 7.6 < 7.9
V4dist = 218 because the optimal value is 0
一些值在范围内 - 它们应该为 0。有些较低,有些较高。
所以,我有两个问题:1)如何读入数据 2)如何创建新变量
我可以访问 SAS 和 R(以及 Excel,但是....)