对于一个学校项目,我发现自己在使用人口普查局当前人口调查的数据。我选择 SPSS 来处理数据,因为在我有限的时间范围内,它似乎是最容易直接使用的软件。一切似乎都很简单,除了一个给我带来麻烦的操作。
对于我的数据集中的每个案例——每个案例代表一个被调查的个体——定义了以下(相关)变量:
- 家庭 ID (HHID)——每个被调查家庭的唯一编号
- 个人 ID (PID)——家庭中每个人的唯一编号
- 人的年龄(AGE)
- 该人是否接受过公共健康保险——0 或 1 (HASHEALTH)
- 个人父亲的个人 ID,如果家庭中存在(如果不存在则为 0)(POPNUM)
- 个人母亲的个人 ID,如果家庭中存在(如果不存在,则为 0)(MOMNUM)
这是问题所在:我需要将任何给定父母的 KIDHASHEALTH 值设置为 HHID 和 POPNUM 或 MOMNUM 值与当前案例的 HHID 和 PID 匹配的最年轻的人的 HASHEALTH 值——从功能上讲,他们最小的孩子。
到目前为止,我一直无法弄清楚如何使用 SPSS 语法来做到这一点。任何人都可以想出一种方法来完成我正在尝试做的事情,用语法或其他方式吗?
非常非常感谢提前。
使用示例数据编辑:
HHID |PID |AGE |POPNUM |MOMNUM |HASHEALTH |KIDHASHEALTH
-----+----+----+-------+-------+----------+------------
1 |1 |45 |0 |0 |0 |0 //KIDHASHEALTH == 0 because
1 |2 |48 |0 |0 |0 |0 //youngest child's HASHEALTH == 0
1 |3 |13 |1 |2 |0 |0
2 |1 |33 |0 |0 |0 |1 // == 1 because youngest child's
2 |2 |28 |0 |0 |0 |1 // HASHEALTH == 1
2 |3 |15 |1 |2 |0 |0
2 |4 |12 |1 |2 |1 |0
-----+----+----+-------+-------+----------+------------