我正在使用Stata。
我从 TUS(即时间使用调查)获得了一个描述性统计数据:全职工人每天花费的总时间(因为这些数据来自卢森堡,全职工作日至少 8 小时)工作人员)。因此,我在 TUS 的子样本上工作,其中只有宣布就业的人。
在这个(子样本)数据集中,每个人有两个观察值,一个在周末,一个在一周内(即,它是一种短面板数据集)。
因为我只对那些全职工作的人感兴趣,所以我想衡量两类人在这两天内的总工作时间:
- 工作日工作时间为 8 小时或以上,周末工作时间为 0 小时(周六和周日)的个人;
- 在工作日和周末工作的个人(例如,服务员、护士、司机等),工作日的工作时间为 8 小时或以上,周末的工作时间为 8 小时或以上。
[问题 1]如何创建一个变量,当个体为 1. 或 2. 时为 1,否则为 0?
[问题 2]一旦我为全职工人创建了虚拟变量,我想创建另一个虚拟变量,对于仅在工作日工作的工人为 1,对于周末工作的工人为 0,我该怎么做那?
[更新] 这里我发布了一部分数据集作为示例(通过datasex获得):
clear
input double(working_act1 working_act2 working_act3 working_act4) float weekend double id_ind
0 0 0 0 0 1 4015801
0 0 0 .3333333333333339 11.666666666666668 0 4017501
0 0 0 0 0 1 4017501
0 0 0 .16666666666666785 8 0 4017601
0 0 0 0 0 1 4017601
0 0 0 0 8.166666666666668 0 4017602
0 0 0 0 0 1 4017602
0 0 0 0 7.166666666666669 0 4017801
0 0 0 0 0 1 4017801
0 0 .16666666666666785 0 3.666666666666668 0 4017802
0 0 0 .33333333333333215 7 1 4017802
0 0 0 0 12.000000000000002 0 4018001
0 0 0 0 0 1 4018001
0 0 0 0 6.333333333333332 0 4018002
0 0 0 0 0 1 4018002
0 0 0 0 9.16666666666667 0 4019201
0 0 0 0 9.16666666666667 1 4019201
0 0 .16666666666666607 .5 8.333333333333334 0 4019504
0 0 0 0 0 1 4019504
0 0 0 0 6.5 0 4019901
0 0 0 0 8 1 4019901
0 0 0 0 6.166666666666668 0 4020001
0 0 0 0 0 1 4020001
end