我有一个例子(在图像描述中留下一个)。
第一列中有几个索引。但是,重复字符的第三个(不仅仅是第三个,因为我有来自一千多个重复间隔的数据)是缺失数据,即“GG”。
问题:我想添加值为“NaN”的特定行(如“GG”)
我想根据重复部分的字符(从'II'到'//\n')在不同的列中显示它的值。
在这种情况下我有什么办法吗?
我有一个例子(在图像描述中留下一个)。
第一列中有几个索引。但是,重复字符的第三个(不仅仅是第三个,因为我有来自一千多个重复间隔的数据)是缺失数据,即“GG”。
问题:我想添加值为“NaN”的特定行(如“GG”)
我想根据重复部分的字符(从'II'到'//\n')在不同的列中显示它的值。
在这种情况下我有什么办法吗?
假设您的数据是所有数据作为列的数据框(如果不是,您首先需要reset_index
):
(df
#.reset_index() # uncomment if first column is index
.assign(cols=df.groupby('col1').cumcount())
.pivot(index='col1', columns='cols', values='col2')
)
输出:
cols 0 1 2
col1
A 0.0 4.0 7.0
B 1.0 5.0 8.0
C 2.0 9.0 NaN
D 3.0 6.0 10.0
输入:
col1 col2
0 A 0
1 B 1
2 C 2
3 D 3
4 A 4
5 B 5
6 D 6
7 A 7
8 B 8
9 C 9
10 D 10