1

我有一个有两列的表,第一列是站点的索引,第二列是 24 小时内每小时的状态数。因此,对于每个站点,我都有 24(行)x2(列)数据。如何将第二列(每个站点 24 行数据)转换为包含 24+1 列和站点索引的行。

我通过使用循环创建新行找到了一个天真的解决方案:

for i in range(numberOfsites):
    i1 = i*24
    i2 = i1 + 24
    newLine = DataFrame(sitesData,index=list(range(i1,i2)), columns=["siteState"]).T

有人可以提出另一个更简单的解决方案吗?先感谢您。

原始数据:(感谢 Andy Hayden 提供数据)

   site_index state
0           1     a
1           1     b
2           1     a
3           2     a
4           2     a
5           2     b

所需数据:

              0  1  2
  site_index
  1           a  b  a
  2           a  a  b
4

1 回答 1

2

虽然这感觉有点 hacky,但您可以使用groupby

In [11]: df
Out[11]:
   site_index state
0           1     a
1           1     b
2           1     a
3           2     a
4           2     a
5           2     b

In [12]: g = df.groupby('site_index')

In [13]: g.apply(lambda x: x.state.reset_index(drop=True).T)
Out[13]:
            0  1  2
site_index
1           a  b  a
2           a  a  b

这也可以使用unstack...

于 2013-06-11T14:53:54.357 回答