我的数据如下所示:
+--------+-----------+---------+
| doctor | datefield | patient |
+--------+-----------+---------+
| A | 1/1/2011 | ABC123 |
| A | 1/20/2011 | AAA123 |
| A | 1/21/2011 | AAA123 |
| | | |
| A | 2/1/2011 | ABC123 |
| A | 2/10/2011 | BBBYYY |
| | | |
| B | 1/1/2011 | ABC123 |
| B | 1/20/2011 | AXA435 |
| B | 1/21/2011 | AAA123 |
| | | |
| B | 2/1/2011 | ABC123 |
| B | 2/10/2011 | BBBYYY |
+--------+-----------+---------+
我想计算每个医生的新病人数as compared to the entire date range for that specific doctor
。
假设2011 年1 月是第一个月。
逻辑:
- 2011 年 1 月,A 医生有 2 名新患者
- 2011 年 2 月,A 医生有 1 名新患者
- 2011 年 1 月,B 医生有 3 名新患者
- 2011 年 2 月,B 医生有 1 名新患者
这是我想要的结果:
+--------+-------+------+----------------+
| doctor | month | year | # new patients |
+--------+-------+------+----------------+
| A | 1 | 2011 | 2 |
| A | 2 | 2011 | 1 |
| B | 1 | 2011 | 3 |
| B | 2 | 2011 | 1 |
+--------+-------+------+----------------+
你能帮我开始吗?