1

我有个问题。

如何将两个变量合二为一,以获得整体频率熊猫?

一个例子

Name, Count
Watch   2
Watch   3
Jacob   4
Jacob   3
Ashley  2
Ashley  2

我想要的输出是

Name    Count
Watch,    5
Jacob,    7
Ashley,   4

对于大约 700 行的数据集,这就是我一直在尝试使用 groupby 的方法。

df.groupby(["NameOfProduct", "Number_Count"]).size().reset_index(name="Time")

它只给我次数,变量出现在数据集中。

希望大家能帮忙。

谢谢你,祝你晚上愉快:)

4

1 回答 1

1

我认为你的问题是你也在分组Count。要获得正确的 groupby ,您只需要 groupby Name。例如:

df.groupby(['Name']).sum()

这将获取CountDataFrame 中每个唯一名称的总和,这将导致您请求的输出。

如果您 groupby ['Name', 'Count'] 并使用size(),则每个组的值最终都会为 1,除了 whenName = AshleyCount=2(在这种情况下,结果将为 2)。这是因为size将返回每个唯一组的大小。

于 2019-10-14T17:32:41.483 回答