2

我有以下熊猫数据框。我需要按 B 列和 A 列进行分组并删除时间戳。所以..在下面......应该有一个总结了A的记录。我如何在熊猫中这样做?

                               A  B
2013-03-15 17:00:00            1  134
2013-03-15 18:00:00          810  134
2013-03-15 19:00:00         1797  134
2013-03-15 20:00:00          813  134
2013-03-15 21:00:00         1323  134
2013-03-16 05:00:00           98  134
2013-03-16 06:00:00          515  134
2013-03-16 10:00:00          377  134
2013-03-16 11:00:00         1798  134
2013-03-16 12:00:00          985  134
2013-03-17 08:00:00          258  134
4

1 回答 1

2

这可以通过简单的 groupby 操作来完成:

import io
import pandas as pd

content='''\
date time                               A  B
2013-03-15 17:00:00            1  134
2013-03-15 18:00:00          810  134
2013-03-15 19:00:00         1797  134
2013-03-15 20:00:00          813  135
2013-03-15 21:00:00         1323  134
2013-03-16 05:00:00           98  134
2013-03-16 06:00:00          515  135
2013-03-16 10:00:00          377  134
2013-03-16 11:00:00         1798  136
2013-03-16 12:00:00          985  136
2013-03-17 08:00:00          258  137'''

df = pd.read_table(io.BytesIO(content), sep='\s+',
                   parse_dates=[[0, 1]], header=0,
                   index_col=0)

print(df.groupby(['B']).sum())

产量

        A
B        
134  4406
135  1328
136  2783
137   258

中的一些值B已更改以显示更有趣的 groupby 操作。

于 2013-03-17T14:27:53.430 回答