问题标签 [pandas-groupby]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

8385 问题

0 投票

3 回答

8645 浏览

pandas - Python pandas如何获得groupby的反转

我有两个数据框。除了一列之外，它们是相同的。我想根据第一个数据帧的平均值更改第二个数据帧的列。对于后者，我必须使用 groupby，但是我不知道如何获得反向。下面是一个最小示例，在此特定示例中，df_two 最终应该与 df_one 相同。我的问题是如何从 tmp 到 df2_new - 请参阅下面的代码。

2014-07-17T13:10:49.510

0 投票

4 回答

120311 浏览

python - 在python中计算DataFrame每一列中的非零值

我有一个 python-pandas-DataFrame，其中第一列是"user_id"标签，其余列是标签（"Tag_0"到"Tag_122"）。

我有以下格式的数据：

我的目标是Sum(Tag)/Count(NonZero(Tags))为每个 user_id实现

df.groupby('user_id').sum()，给了我sum(tag)，但是我对计算非零值一无所知

是否有可能Sum(Tag)/Count(NonZero(Tags))在一个命令中实现？

在 MySQL 中，我可以按如下方式实现：-

任何帮助将不胜感激。

python pandas dataframe pandas-groupby

2014-09-26T07:04:13.463

0 投票

1 回答

2411 浏览

python - 基于其他列条件的组中的 Pandas 数据帧最大值

我不确定以前是否有人问过这个问题。在熊猫数据框中，我有类似的数据

我想得到

在上面的示例中（来自第一个表）z 分别从 B 和 C 的 0 变为 B 的 2 和 C 的 2.5，然后 B 和 C 变为 0。一个重要的属性是 B 和 C 可以不同，但是它们会去0 同时。把它想象成一个计数器，当设备关闭时，你的所有计数器都会回到 0。上面例子中的设备是 y 和 z。

同样从第一个表中，您还可以看到 B 和 C 的 y 分别从 0 变为 1，但是它们从未回到 0，但我仍然需要 B 和 C 的最大值，即 1 和 1。

我可以编写一些 python 代码来循环并进行必要的转换，但我想知道这是否可以通过一些 pandas 魔法来实现。

python pandas dataframe max pandas-groupby

2014-10-09T16:16:17.853

0 投票

1 回答

778 浏览

python - 使用熊猫根据键变量将多行转换为单行

输入数据集

预期输出数据集：

如何通过 pandas 编程实现预期的数据集？

python sql pandas rows pandas-groupby

2014-10-12T06:06:12.673

0 投票

3 回答

3662 浏览

python - Pandas 中的 Groupby，用 [] 填充缺失的组

欢迎任何有关此问题更准确标题的帮助..

我有一个pandas包含客户级别观察的数据框，记录日期以及客户在该日期消费的项目。它看起来像这样。

该数据集中的每个观察结果都与一个独特的商店日组合有关，但每个商店日观察结果都以消费的正数为条件列出，即df[items] > 0每个商店日对。

所以我没有，例如

等等

我需要按storeand对这个数据框进行分组day，然后对每个存储日组中的所有 obs 运行一些操作。

但是，我希望这些行存在并且长度为 0（空集），我不确定执行此操作的最佳方法。这是一个非常简单的玩具数据集。真实的非常大。

我真的不想在使用之前添加观察结果df.groupby(['store', 'day'])，因为我对每个商店日组运行其他计算，该计算使用每个组的长度作为在特定商店和日期中记录的客户数量的度量。因此，如果我添加这些观察结果b3和b4，那么看起来有 2 位顾客在第 3 天和第 4 天访问了商店 b - 而没有（每个人在第 3 天和第 4 天在商店 b 什么都没买）。

python pandas dataframe pandas-groupby

2014-11-11T17:23:57.760

0 投票

1 回答

520 浏览