1

我想展平数据框,如下例所示。

我有下一个数据框:

    file name   format  location
0   movie1.mp4  NaN     NaN
1   NaN         NaN     D:/mymovies
2   NaN         mp4     NaN

我想将其转换为:

    file name   format  location
0   movie1.mp4  mp4 D:/mymovies

任何想法?谢谢!

4

1 回答 1

0

我相信您可以对第一列使用前向填充,如果第一个非缺失值是组的第一个值,然后与GroupBy.first每个组的第一个非缺失值聚合:

df = df.groupby(df['file name'].ffill()).first().reset_index(drop=True)
print (df)
    file name format     location
0  movie1.mp4    mp4  D:/mymovies

详情

print (df['file name'].ffill())
0    movie1.mp4
1    movie1.mp4
2    movie1.mp4
Name: file name, dtype: object

如果第一列是索引:

df = df.groupby(df.index.to_series().ffill()).first().reset_index()
print (df)
    file name format     location
0  movie1.mp4    mp4  D:/mymovies
于 2019-08-28T05:27:56.157 回答