这是我的数据集
第 1 列:脂质水平
第 2 栏:年龄
第 3 列:脂肪含量类别
第 4 列:性别(1=男性)
0.73 1 1 1
0.67 1 2 1
0.15 1 3 1
0.86 2 1 1
0.67 2 2 1
0.15 2 3 1
0.94 3 1 1
0.81 3 2 1
0.26 3 3 1
0.23 4 1 2
1.40 4 1 1
1.32 4 2 1
0.15 4 3 1
1.62 5 1 1
1.41 5 2 1
0.78 5 3 1
9.78 5 1 1
这是我使用此代码运行的一些不同分析,但我不太确定为什么 SAS 没有编译。
在做任何其他事情之前,我手动设置了一个永久库。
libname di ‘c:\diet’;
data di.HW3 Data;
infile hw3 data.sas;
input Lipidlevel Age Fatcontent Gender;
run;
接下来,我想使用每个年龄组的脂肪含量类别的脂质水平 ODS 生成一个图。
ods graphics on;
proc sgplot data=newdiet;
var=Age;
scatter Age/Lipidlevel
ods graphics off;
为了更清楚地说明我将如何为连接 3 个数据点的每个年龄组制作一条线,用不同的颜色为每条线着色并用星号表示每个数据点,并在 X 轴下方制作一个图例并为图表?(我以为最后一部分是自动出现的)
现在我想使用 ODS 生成两组不同的汇总统计信息。a) 显示每个年龄组的血脂水平的平均值、中位数、样本量和标准差。
Proc means data=newdiet;
var Lipidlevel;
run;
b) 报告每个脂肪含量类别的脂质水平的样本量、平均值和标准差。
Proc means data=newdiet;
var Lipidlevel;
run;
最后,谁能给我一些关于数据分层的建议,如下所示?我想为 Age Group 和 Fat Content Category 变量创建标签和格式。年龄组从 1 到 5 编码,对应于:15-24;25-34; 35-44; 45-54; 55-64。脂肪含量类别编码为 1 到 3,对应于:极低;相当低;中等偏低。我不知道该怎么做。我能想到的唯一方法是进入原始数据集并手动对其进行排序。