0

我有一个从网络导入的熊猫数据框,如下所示。

不幸的是,袋子大小的值在不同的行中。

姓名 长度 宽度 高度
詹姆士 一个 15.32
詹姆士 一个 27.33
詹姆士 20.69
詹姆士 15.87
奥西内斯 一个 17.88
奥西内斯 一个 18.94
奥西内斯 一个 14.56
奥西内斯 16.82

我想根据“名称”和“袋”列在一行中表达尺寸属性,如下所示:

姓名 长度 宽度 高度
詹姆士 一个 15.32 27.33
詹姆士 15.87 20.69
奥西内斯 一个 17.88 18.94 14.56
奥西内斯 16.82

我怎么解决这个问题?如果你能帮助我,我将不胜感激。

4

1 回答 1

1

使用groupby_first

out = df.groupby(['Name', 'Bag'], sort=False, as_index=False).first()
print(out)

# Output
      Name Bag  Length  Width  Height
0    James   A   15.32  27.33     NaN
1    James   B     NaN  15.87   20.69
2  Ausines   A   17.88  18.94   14.56
3  Ausines   B     NaN  16.82     NaN
于 2022-02-27T10:12:14.180 回答