在我的数据集中,我的性别变量中目前有标签男性和女性。
因为我要运行一个回归模型,所以我想改变这个,所以男性和女性被重新编码为 0 和 1。但是,我不知道该怎么做!
非常感谢任何帮助
您说您的性别变量是带有标签的数字。要确定数值,请在没有标签的情况下制作表格
tab gender, nolabel
假设输出显示性别变量编码为男性==1 和女性==2。要将其重新编码为 0 和 1,我将创建一个新的二元变量,称为女性,其中女性==1 和男性==0。
gen female=.
replace female=1 if gender==2
replace female=0 if gender==1
如果您想为新的女性变量添加标签,您可以通过定义新标签并将其分配给变量来实现:
label define FEMALE 1 "female" 0 "male"
label values female FEMALE
然后,您可以通过使用和不使用标签的制表来测试这一点:
tab female
tab female, nolabel
如果您不再需要原始的性别变量,可以删除它:
drop gender
然后,您可以根据需要将新的female变量重命名为gender,但通常建议您在编码为 1 的任何值之后命名二分变量,因此我将其保留为female。
rename female gender
你需要这样的事情:
recode gender (X = 0) (Y = 1), gen(gender_dummy)
其中 X 和 Y 是您要重新编码的值。您可以发出 alabel list
以找出编码是什么。