问题标签 [pandas-groupby]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 如何将数据框行分组到熊猫 groupby 中的列表中
我有一个熊猫数据框df
,例如:
我想按第一列分组并将第二列作为行中的列表:
是否可以使用 pandas groupby 做这样的事情?
python - 根据 Pandas 中的组大小对分组数据进行排序
我的数据集中有两列,col1 和 col2。我想根据 col1 对数据进行分组,然后根据每个组的大小对数据进行排序。也就是说,我想按组的大小升序显示组。
我编写了用于分组和显示数据的代码,如下所示:
在显示数据之前,我需要根据组大小对其进行排序,这是我无法做到的。
python - Pandas groupby 累计总和
我想在我的 Pandas 数据框中添加一个累积总和列,以便:
变成:
我尝试了各种组合,df.groupby
但df.agg(lambda x: cumsum(x))
无济于事。
python - 熊猫:groupby后如何获得特定的组?
我想按一个名为“A”的列对数据框进行分组,并检查一个特定的组。
但是,我不知道如何访问一个组,例如,我希望
会给我第一组
或者
会给我所在的组A=='foo'
。
然而,Pandas 并不是这样工作的。
我在网上找不到类似的例子。
python - Group Pandas DataFrame by row name
I have a simple Pandas DataFrame with row names and 2 columns, sort of like the following.
As with the example above, some row names repeat. I want to group my DataFrame by row names so that I can then perform aggregate operations by group (e.g., count, mean).
For instance, I might want to find out that row1
and row4
appear once each in my df
whereas row2
appears once.
I know of the groupby
method, but from the examples I've seen online it only groups by column values, not row names. Is that the case? Should I just make my rownames a column in the DataFrame?
python - DataFrame:添加具有组大小的列
我有以下数据框:
我想添加最后一列count,其中包含属于digits组的fsq的数量,即:
由于有 3 个fsq行的位数等于 1,因此 2 个fsq行的位数等于 2,依此类推。
python - 进行 groupby 时保留其他列
我正在使用groupby
pandas 数据框来删除所有没有特定列最小值的行。像这样的东西:
但是,如果我有两个以上的列,则其他列(例如otherstuff
在我的示例中)将被删除。我可以使用 保留这些列groupby
,还是必须找到一种不同的方法来删除行?
我的数据看起来像:
最终应该像:
但我得到的是:
我一直在查看文档,但找不到任何东西。我试过了:
但是这些都不起作用(我意识到最后一个语法是用于在创建组后进行聚合)。
python - 基于 groupby 拆分 pandas 数据帧
我想根据 ZZ 列拆分以下数据框
作为输出,我想要一个新的列DataFrame
,该N0_YLDF
列分成 4 个,每个唯一值对应一个新列ZZ
。我该怎么做?我可以做 groupby,但不知道如何处理分组的对象。
python - 熊猫数据框分组日期时间月
考虑一个 csv 文件:
我可以阅读此内容,并将日期列重新格式化为日期时间格式:
我一直在尝试按月对数据进行分组。似乎应该有一种明显的方式来访问月份并以此进行分组。但我似乎做不到。有谁知道怎么做?
我目前正在尝试按日期重新索引:
我可以像这样访问月份:
但是,我似乎找不到按月汇总的功能。
python - 如何更改组中的原始 DataFrame?
假设我有以下 DataFrame:
我想arbitrarydata
根据其他两个列中的值为该列分配一个值。一个天真的方法如下:
自然,这不会将更改传播回df
. 有没有办法修改一个组,使更改反映在原始 DataFrame 中?