我很难找到一种清晰、通用的方式来表达这个问题,如果重复了,我深表歉意。情况如下:
我有一个记录协作标记数据的表,每一行都存储一个注释(即特定用户在特定时间用特定标签标记特定项目)。为了清楚起见,这是一个示例:
+---------+---------+--------+------------+
| user_id | item_id | tag_id | tag_month |
+---------+---------+--------+------------+
| 1040740 | 2653 | 1344 | 2005-07-01 |
| 1040740 | 3602 | 1344 | 2005-07-01 |
| 1040740 | 17746 | 217 | 2005-07-01 |
| 1040740 | 21426 | 1344 | 2005-07-01 |
| 1040740 | 22224 | 180 | 2005-07-01 |
+---------+---------+--------+------------+
...等等。我要逐月计算的是所有项目中每个项目的平均注释数。换句话说,对于每个月,该月每个唯一项目的平均行数是多少?我的数据集总共跨越 94 个月,因此我想要的查询输出应该是 94 行,每行都有该月每个项目的平均注释数。请注意,“user_id”列与此完全无关。