我想为每一行设置 ART_IN_TICKET 的值是与该行具有相同 TICKET_ID 的行数。
例如,对于该数据帧的前 5 行,TICKET_ID 为 35592159,ART_IN_TICKET 应为 5,因为有 5 行具有相同的 TICKET_ID。
也可以有其他解决方案。一个相对简单的解决方案是获取每个的行数TICKET_ID
,然后将新的 df 与这个合并以获得最终结果ART_IN_TICKET
。假设上述数据框位于df
.
count_df = df[['TICKET_ID', 'ART_IN_TICKET']].groupby("TICKET_ID").count().reset_index()
df = df[list(set(df.columns.tolist())-set(["ART_IN_TICKET"]))] # Removing ART_IN_TICKET column before merging
final_df = df.merge(count_df, on="TICKET_ID")