-1

在我的数据集中,我的性别变量中目前有标签男性和女性。

因为我要运行一个回归模型,所以我想改变这个,所以男性和女性被重新编码为 0 和 1。但是,我不知道该怎么做!

非常感谢任何帮助

4

2 回答 2

0

您说您的性别变量是带有标签的数字。要确定数值,请在没有标签的情况下制作表格

tab gender, nolabel

假设输出显示性别变量编码为男性==1 和女性==2。要将其重新编码为 0 和 1,我将创建一个新的二元变量,称为女性,其中女性==1 和男性==0。

gen female=.                     
replace female=1 if gender==2     
replace female=0 if gender==1     

如果您想为新的女性变量添加标签,您可以通过定义新标签并将其分配给变量来实现:

label define FEMALE 1 "female" 0 "male" 
label values female FEMALE

然后,您可以通过使用和不使用标签的制表来测试这一点:

tab female
tab female, nolabel

如果您不再需要原始的性别变量,可以删除它:

drop gender

然后,您可以根据需要将新的female变量重命名为gender,但通常建议您在编码为 1 的任何值之后命名二分变量,因此我将其保留为female

rename female gender
于 2015-01-31T20:24:33.983 回答
0

你需要这样的事情:

recode gender (X = 0) (Y = 1), gen(gender_dummy)

其中 X 和 Y 是您要重新编码的值。您可以发出 alabel list以找出编码是什么。

于 2015-01-01T23:14:15.400 回答