我有一个如下所示的数据集:
UserID Query Asthma Stroke
142 abc dr 0 0
142 asthma 1 0
142 stroke 0 1
145 stroke 0 1
145 pizza 0 0
有数十万个用户 ID,每个用户提交的查询数量不定。为了做进一步的分析,我需要为每个用户 ID 总结“哮喘”和“中风”。有什么建议吗?您能否推荐处理此类数据集的资源?
提前谢谢你......我对此很陌生。