问题标签 [pandas-groupby]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
15 回答
388373 浏览

python - 如何将数据框行分组到熊猫 groupby 中的列表中

我有一个熊猫数据框df,例如:

我想按第一列分组并将第二列作为行中的列表

是否可以使用 pandas groupby 做这样的事情?

0 投票
3 回答
30797 浏览

python - 根据 Pandas 中的组大小对分组数据进行排序

我的数据集中有两列,col1 和 col2。我想根据 col1 对数据进行分组,然后根据每个组的大小对数据进行排序。也就是说,我想按组的大小升序显示组。

我编写了用于分组和显示数据的代码,如下所示:

在显示数据之前,我需要根据组大小对其进行排序,这是我无法做到的。

0 投票
6 回答
133514 浏览

python - Pandas groupby 累计总和

我想在我的 Pandas 数据框中添加一个累积总和列,以便:

变成:

我尝试了各种组合,df.groupbydf.agg(lambda x: cumsum(x))无济于事。

0 投票
2 回答
15426 浏览

python - 熊猫:groupby后如何获得特定的组?

我想按一个名为“A”的列对数据框进行分组,并检查一个特定的组。

但是,我不知道如何访问一个组,例如,我希望

会给我第一组

或者

会给我所在的组A=='foo'

然而,Pandas 并不是这样工作的。

我在网上找不到类似的例子。

0 投票
1 回答
4176 浏览

python - Group Pandas DataFrame by row name

I have a simple Pandas DataFrame with row names and 2 columns, sort of like the following.

As with the example above, some row names repeat. I want to group my DataFrame by row names so that I can then perform aggregate operations by group (e.g., count, mean).

For instance, I might want to find out that row1 and row4 appear once each in my df whereas row2 appears once.

I know of the groupby method, but from the examples I've seen online it only groups by column values, not row names. Is that the case? Should I just make my rownames a column in the DataFrame?

0 投票
2 回答
7369 浏览

python - DataFrame:添加具有组大小的列

我有以下数据框:

我想添加最后一列count,其中包含属于digits组的fsq的数量,即:

由于有 3 个fsq行的位数等于 1,因此 2 个fsq行的位数等于 2,依此类推。

0 投票
5 回答
73894 浏览

python - 进行 groupby 时保留其他列

我正在使用groupbypandas 数据框来删除所有没有特定列最小值的行。像这样的东西:

但是,如果我有两个以上的列,则其他列(例如otherstuff在我的示例中)将被删除。我可以使用 保留这些列groupby,还是必须找到一种不同的方法来删除行?

我的数据看起来像:

最终应该像:

但我得到的是:

我一直在查看文档,但找不到任何东西。我试过了:

但是这些都不起作用(我意识到最后一个语法是用于在创建组后进行聚合)。

0 投票
4 回答
55437 浏览

python - 基于 groupby 拆分 pandas 数据帧

我想根据 ZZ 列拆分以下数据框

作为输出,我想要一个新的列DataFrame,该N0_YLDF列分成 4 个,每个唯一值对应一个新列ZZ。我该怎么做?我可以做 groupby,但不知道如何处理分组的对象。

0 投票
5 回答
214832 浏览

python - 熊猫数据框分组日期时间月

考虑一个 csv 文件:

我可以阅读此内容,并将日期列重新格式化为日期时间格式:

我一直在尝试按月对数据进行分组。似乎应该有一种明显的方式来访问月份并以此进行分组。但我似乎做不到。有谁知道怎么做?

我目前正在尝试按日期重新索引:

我可以像这样访问月份:

但是,我似乎找不到按月汇总的功能。

0 投票
1 回答
1736 浏览

python - 如何更改组中的原始 DataFrame?

假设我有以下 DataFrame:

我想arbitrarydata根据其他两个列中的值为该列分配一个值。一个天真的方法如下:

自然,这不会将更改传播回df. 有没有办法修改一个组,使更改反映在原始 DataFrame 中