我有一个数据集:
- 一个独特的
person_id
. - 该人过去学习的不同科目(
humanities
、IT
等business
)。 - 每个
Degree
主题的。
这看起来如下:
person_id 人文商务 IT 学位 1 0 1 0 理学士 1 0 0 1 理学硕士 2 1 0 0 博士 2 0 1 0 理学硕士 2 0 0 1 理学士 3 0 0 1 理学士
我想转换这个数据集,以便我拥有由每个可能的学位和主题组合组成的变量person_id
。
这个想法是,当我collapse
稍后通过时person_id
,我将为每个人设置一个值(即0
or 1
)。我有十二个不同的科目和四个主要学位。
person_id humanities business IT Degree BSc_humanities MSc_Hum
1 0 1 0 BSc 0 0
1 0 0 1 MSc 0 0
2 1 0 0 PhD 0 1
2 1 0 0 MSc 0 1
2 0 0 1 BSc 0 1
3 0 0 1 BSc 0 0
实现这一目标的最佳方法是什么?