python - 大熊猫的groupby是可交换的吗？

Question

我想知道是否由以下人员选择的行：

groupby(['a', 'b'])

与选择的行相同：

groupby(['b', 'a'])

在这种情况下，行的顺序无关紧要。

有groupby没有不满足交换性质的情况？

score 8 · Accepted Answer

根据定义groupby和使用in时应用的逻辑pandas，它将始终是可交换的：

groupby 操作涉及拆分对象、应用函数和组合结果的某种组合。

这种组合是线性的，因此是可交换的。重要的是，当传递多个by值时，新索引值中会有一个顺序，在处理它们时应该牢记这一顺序。

来自维基百科的线性组合和交换性质：

在数学中，线性组合是由一组项构成的表达式，通过将每个项乘以一个常数并将结果相加。多年来，简单的运算（例如数字的乘法和加法）是可交换的这一想法一直是隐含的假设。

score 4 · Accepted Answer

我认为计数顺序无关紧要，只有在 groupby 获得第一列/级别之后，就像您在列表中有列一样。

df = pd.DataFrame({
        'a':list('aaaaaa'),
         'b':[4,5,4,5,5,4],
         'c':[7,8,9,4,2,3],

})

groupby聚合后的级别顺序：

df1 = df.groupby(['a', 'b']).sum()
print (df1)
      c
a b    
a 4  19
  5  14

df2 = df.groupby(['b', 'a']).sum()
print (df2)
      c
b a    
4 a  19
5 a  14

和列：

df3 = df.groupby(['a', 'b'], as_index=False).sum()
print (df3)
   a  b   c
0  a  4  19
1  a  5  14

df4 = df.groupby(['b', 'a'], as_index=False).sum()
print (df4)
   b  a   c
0  4  a  19
1  5  a  14

如果对与原始结果相同大小的新列使用变换是相同的：

df['new1'] = df.groupby(['a', 'b'])['c'].transform('sum')
df['new2'] = df.groupby(['b', 'a'])['c'].transform('sum')
print (df)
   a  b  c  new1  new2
0  a  4  7    19    19
1  a  5  8    14    14
2  a  4  9    19    19
3  a  5  4    14    14
4  a  5  2    14    14
5  a  4  3    19    19

score 3 · Accepted Answer

3

是的，最后的组总是一样的。

唯一的区别是显示行的顺序。

于 2019-12-17T13:05:12.700 回答

python - 大熊猫的groupby是可交换的吗？

3 回答 3

Related

Reference