42

我在 python pandas 中有一个数据框,其中几列取自 CSV 文件。

例如,数据 =:

Day P1S1 P1S2 P1S3 P2S1 P2S2 P2S3
1   1    2    2    3    1    2
2   2    2    3    5    4    2

我需要的是获取名称以 P1 开头的所有列的总和...类似于 P1* 的通配符。

类似于以下内容的内容会出现错误:

P1Sum = 数据["P1*"]

有什么理由用熊猫做这个吗?

4

3 回答 3

63

我找到了答案。

使用问题中的数据,数据框:

from pandas import *

P1Channels = data.filter(regex="P1")
P1Sum = P1Channels.sum(axis=1)
于 2012-09-24T18:05:26.103 回答
5

列上的列表推导允许if条件中的更多过滤器:

In [1]: df = pd.DataFrame(np.arange(15).reshape(5, 3), columns=['P1S1', 'P1S2', 'P2S1'])

In [2]: df
Out[2]: 
   P1S1  P1S2  P2S1
0     0     1     2
1     3     4     5
2     6     7     8
3     9    10    11
4    12    13    14

In [3]: df.loc[:, [x for x in df.columns if x.startswith('P1')]].sum(axis=1)
Out[3]: 
0     1
1     7
2    13
3    19
4    25
dtype: int64
于 2018-12-06T16:45:34.063 回答
1

感谢 jbssm 的提示,对于寻找总和的其他人,我最后添加.sum()了,所以:

P1Sum= P1Channels.sum(axis=1).sum()
于 2016-09-01T18:18:53.340 回答