0

在此处输入图像描述

我有一个例子(在图像描述中留下一个)。

第一列中有几个索引。但是,重复字符的第三个(不仅仅是第三个,因为我有来自一千多个重复间隔的数据)是缺失数据,即“GG”。

问题:我想添加值为“NaN”的特定行(如“GG”)

我想根据重复部分的字符(从'II'到'//\n')在不同的列中显示它的值。

在这种情况下我有什么办法吗?

4

1 回答 1

0

假设您的数据是所有数据作为列的数据框(如果不是,您首先需要reset_index):

(df
   #.reset_index() # uncomment if first column is index
   .assign(cols=df.groupby('col1').cumcount())
   .pivot(index='col1', columns='cols', values='col2')
)

输出:

cols    0    1     2
col1                
A     0.0  4.0   7.0
B     1.0  5.0   8.0
C     2.0  9.0   NaN
D     3.0  6.0  10.0

输入:

   col1  col2
0     A     0
1     B     1
2     C     2
3     D     3
4     A     4
5     B     5
6     D     6
7     A     7
8     B     8
9     C     9
10    D    10
于 2021-11-01T09:05:07.403 回答