-2

我正在尝试使用以下代码,但它给出了错误

 01jan1986 
05jan2001 
07mar1983 
and so on I need to get the exact age of them
gen agecat=1
if age 0-20==1
if age 21-40==2
if age 41-60==3
if age 61-64==4```
4

3 回答 3

1

您在其他答案中得到了一些很好的建议,但这可以像您想要的一样简单。

考虑这个例子,注意将数据呈现为我们可以运行的代码是一个非常有用的细节。

* Example generated by -dataex-. For more info, type help dataex
clear
input str9 sdate float dob
"01jan1986"  9497
"05jan2001" 14980
"07mar1983"  8466
end
format %td dob

2020 年底的年龄只是 2020 年减去人们出生的年份。如果更有意义,请使用任何其他年份。

. gen age = 2020 - year(dob)

. l

     +-----------------------------+
     |     sdate         dob   age |
     |-----------------------------|
  1. | 01jan1986   01jan1986    34 |
  2. | 05jan2001   05jan2001    19 |
  3. | 07mar1983   07mar1983    37 |
     +-----------------------------+

对于 20 年的垃圾箱,为什么不让它们自我描述。因此,使用此代码,20、40 等是每个 bin 的上限。(如果您的数据中有 1 岁以下的孩子,您可能需要对其进行调整。)

. gen age2 = 20 * ceil(age/20)

. l

     +------------------------------------+
     |     sdate         dob   age   age2 |
     |------------------------------------|
  1. | 01jan1986   01jan1986    34     40 |
  2. | 05jan2001   05jan2001    19     20 |
  3. | 07mar1983   07mar1983    37     40 |
     +------------------------------------+

本文是对使用 Stata 进行舍入和分箱的回顾。

于 2021-06-19T09:19:58.670 回答
1

为了建立 Wouter 的答案,你可以做这样的事情来计算年龄到 10 岁:

clear
set obs 12
set seed 12352

global today = date("18Jun2021", "DMY")

* Sample Data
gen dob = runiformint(0,17000) // random Dates
format dob %td

* Create Age
gen age = round((ym(year(${today}),month(${today})) - ym(year(dob), month(dob)))/ 12,0.1)

* Correct age if dob in current month, but after today's date
replace age = age - 0.1 if (month(${today}) == month(dob)) & (day(dob) > day(${today}))

* age category
gen age_cat = cond(age <= 20, 1, cond(age <= 40, 2, cond(age <= 60, 3, cond(age <= 64, 4, .))))

倒数第二步很重要,因为如果他们的出生日期与比较日期在同一个月但尚未实现,则它会减少年龄。


     +----------------------------+
     |       dob    age   age_cat |
     |----------------------------|
  1. | 30jan2004   17.4         1 |
  2. | 14aug1998   22.8         2 |
  3. | 06aug1998   22.8         2 |
  4. | 31aug1994   26.8         2 |
  5. | 27mar1990   31.3         2 |
     |----------------------------|
  6. | 12jun1968     53         3 |
  7. | 05may1964   57.1         3 |
  8. | 06aug1994   26.8         2 |
  9. | 21jun1989   31.9         2 |
 10. | 10aug1984   36.8         2 |
     |----------------------------|
 11. | 22oct2001   19.7         1 |
 12. | 03may1972   49.1         3 |
     +----------------------------+

请注意,小数点只是近似值,因为它使用生日月份而不是实际日期。

于 2021-06-18T16:22:46.920 回答
1

这是一种方法:

gen age_cat = cond(age <= 20, 1, cond(age <= 40, 2, cond(age <= 60, 3, cond(age <= 64, 4, .))))

您可能还想查看egen, cut,请参阅help egen

于 2021-06-18T11:57:34.440 回答