5

我有一些格式有点奇怪的雷达数据,我不知道如何使用 pandas 库正确旋转它。

我的数据:

    speed   time
loc     
A    63  0000
B    61  0000
C    63  0000
D    65  0000
A    73  0005
B    71  0005
C    73  0005
D    75  0005

我想把它变成一个看起来像这样的 DataFrame:

    0000    0005
loc     
A    63     73
B    61     71
C    63     73
D    65     75

我做了很多摆弄,但似乎无法使语法正确。有人可以帮忙吗?

谢谢!

4

2 回答 2

5

您可以在此处使用 pivot 方法:

In [71]: df
Out[71]: 
     speed  time
loc             
A       63     0
B       61     0
C       63     0
D       65     0
A       73     5
B       71     5
C       73     5
D       75     5

In [72]: df.reset_index().pivot('loc', 'time', 'speed')
Out[72]: 
time   0   5
loc         
A     63  73
B     61  71
C     63  73
D     65  75
于 2012-11-04T05:53:01.027 回答
3

假设您的数据源位于 csv 文件中,

from pandas.io.parsers import read_csv
df = read_csv("radar_data.csv")

df  # shows what is in df

       loc  speed  time
0    A     63     0
1    B     61     0
2    C     63     0
3    D     65     0
4    A     73     5
5    B     73     5
6    C     75     5
7    D     75     5
8    A     67     0
9    B     68     0
10   C     68     0
11   D     70     0

请注意,我尚未设置loc为索引,因此它使用自动增量整数索引。

panel = df.set_index(['loc', 'time']).sortlevel(0).to_panel()

但是,如果您的数据框已经loc用作索引,我们将需要将该time列附加到其中,以便我们拥有一个本地时间层次索引。这可以使用方法中的新append选项来完成set_index。像这样:-

panel = df.set_index(['time'], append=True).sortlevel(0).to_panel()

无论哪种情况,我们都应该达到这种情况:-

panel  # shows what panel is

<class 'pandas.core.panel.Panel'>
Dimensions: 1 (items) x 4 (major) x 2 (minor)
Items: speed to speed
Major axis: A to D
Minor axis: 0 to 5

panel["speed"]  # <--- This is what you are looking for.


time   0   5
loc         
A     63  67
B     73  61
C     68  73
D     63  68

希望这可以帮助。

于 2012-11-04T05:24:25.860 回答