我正在尝试在名为 volume 的数据框中创建一个新列。DF 已经包含其他列,例如市场。我想要做的是按价格和公司分组,然后得到他们的数量并将其添加到一个名为 volume 的新列中。这是我所拥有的:
df['volume'] = df.groupby(['price', 'company']).transform('count')
这确实创建了一个新列,但是,它给了我所有的行。我不需要所有的行。例如,在转换之前我会得到 4 行,在转换之后我仍然会得到 4 行,但有一个新列。
market company price volume
LA EK 206.0 2
LA SQ 206.0 1
LA EK 206.0 2
LA EK 36.0 3
LA EK 36.0 3
LA SQ 36.0 1
LA EK 36.0 3
我想删除重复的行。有没有我可以用 groupby 做的查询,它只会显示像这样的行:
market company price volume
LA EK 206.0 2
LA SQ 206.0 1
LA SQ 36.0 1
LA EK 36.0 3