我想展平数据框,如下例所示。
我有下一个数据框:
file name format location
0 movie1.mp4 NaN NaN
1 NaN NaN D:/mymovies
2 NaN mp4 NaN
我想将其转换为:
file name format location
0 movie1.mp4 mp4 D:/mymovies
任何想法?谢谢!
我想展平数据框,如下例所示。
我有下一个数据框:
file name format location
0 movie1.mp4 NaN NaN
1 NaN NaN D:/mymovies
2 NaN mp4 NaN
我想将其转换为:
file name format location
0 movie1.mp4 mp4 D:/mymovies
任何想法?谢谢!
我相信您可以对第一列使用前向填充,如果第一个非缺失值是组的第一个值,然后与GroupBy.first每个组的第一个非缺失值聚合:
df = df.groupby(df['file name'].ffill()).first().reset_index(drop=True)
print (df)
file name format location
0 movie1.mp4 mp4 D:/mymovies
详情:
print (df['file name'].ffill())
0 movie1.mp4
1 movie1.mp4
2 movie1.mp4
Name: file name, dtype: object
如果第一列是索引:
df = df.groupby(df.index.to_series().ffill()).first().reset_index()
print (df)
file name format location
0 movie1.mp4 mp4 D:/mymovies