5

假设我有一个数据框:

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.rand(4,5), columns = list('abcde'))

我想df.a从所有其他列中减去列中的条目。换句话说,我想获得一个数据框,其中包含以下列的列:

| col_b - col_a| col_c - col_a| col_d - col_a|

我已经尝试过df - df.a,但这会产生一些奇怪的东西:

  0   1   2   3   a   b   c   d   e
0 NaN NaN NaN NaN NaN NaN NaN NaN NaN
1 NaN NaN NaN NaN NaN NaN NaN NaN NaN
2 NaN NaN NaN NaN NaN NaN NaN NaN NaN
3 NaN NaN NaN NaN NaN NaN NaN NaN NaN

如何在 Pandas 中进行这种类型的列操作?另外,只是想知道,有什么作用df -df.a

4

1 回答 1

7

你可能想要

>>> df.sub(df.a, axis=0)
   a         b         c         d         e
0  0  0.112285  0.267105  0.365407 -0.159907
1  0  0.380421  0.119536  0.356203  0.096637
2  0 -0.100310 -0.180927  0.112677  0.260202
3  0  0.653642  0.566408  0.086720  0.256536

df-df.a基本上是尝试沿另一个轴进行减法,因此索引不匹配,并且当使用诸如减法之类的二元运算符时,“不匹配的索引将合并在一起”(如文档所述)。由于索引不匹配,您最终会得到 0 1 2 3 a b c d e.

For example, you could get to the same destination more indirectly by transposing things, (df.T - df.a).T, which by flipping df means that the default axis is now the right one.

于 2013-02-19T03:55:18.523 回答