我有一个如下所示的数据框:
place user count item
2013-06-01 New York john 2 book
2013-06-01 New York john 1 potato
2013-06-04 San Francisco john 5 laptop
2013-06-04 San Francisco jane 6 tape player
2013-05-02 Houston michael 2 computer
我正在尝试计算(date, user)
每个独特组合的数量place
- 或者,换句话说,每个城市的“独特访问”数量。所以
New York
它会是一个,因为San Francisco
它会是两个,因为Houston
它会是一个。
我尝试执行以下操作:
df.groupby([df.index, user, place]).place.size()
但这只是返回count
每个地方的总数。我觉得我在这里遗漏了一些非常明显的东西,但我看不出它是什么。有什么帮助吗?