我有一个包含 7 列的数据框,如下所示:
Bank Name | Number | Firstname | Lastname | ID | Date1    | Date2
B1        | 1      | ABC       | EFG      | 12 | Somedate | Somedate
B2        | 2      | ABC       | EFG      | 12 | Somedate | Somedate
B1        | 1      | DEF       | EFG      | 12 | Somedate | Somedate
B3        | 3      | ABC       | GHI      | 13 | Somedate | Somedate
B4        | 4      | XYZ       | FHJ      | 13 | Somedate | Somedate
B5        | 5      | XYZ       | DFI      | 13 | Somedate | Somedate
我想为每个创建一个包含 4 个元素的元组ID,这样每个元组元素代表每个元组(Bank Name, Number, Firstname, Lastname),ID并且这些元组元素的值是该 ID 的相应列中存在的不同元素的计数。例如:对于ID = 12,元组应该是(2, 2, 2, 1)元ID=13,组应该是(3, 3, 2, 3)
通过执行以下操作,我可以获取特定 ID 的所有行:
print(df.loc[df['ID'] == '12'])
但是,我不知道如何对 ID 列中的每个值执行此操作(很像 SQL 中的 group by 子句,并且还获取计数而不是行中的实际值。
请帮忙。