我有一个非常大的 DataFrame,我想做一些重要的分组比较。作为一个例子,让我们采取以下示例:
df = pd.DataFrame({'A': ['foo', 'bar'] * 3,
'B': ['me', 'you', 'me'] * 2,
'C': [5, 2, 3, 4, 6, 9]})
现在我想按 A 列分组,并有效地循环遍历这些组,并按以下方式进行逐行比较:
gb = df.groupby(['A'])
for k, gp in gb:
for i in arange(len(gp['C'])):
sum = 0
for j in arange(len(gp['C'])):
if (i != j):
sum = sum + gp['C'].irow(j)
print gp['C'].irow(i) - sum
是否有可能更有效地执行此操作并将其结果分配给数据框中的单独列。
我将非常感谢您的帮助
安迪