我有一个看起来或多或少像这样的数据框:
import pandas as pd
df = pd.DataFrame([list('AAABBBAAA')]).T
df.columns = [ 'type']
print(df)
type
0 A
1 A
2 A
3 B
4 B
5 B
6 B
7 A
8 A
9 A
10 B
假设我的 DataFrame 已经排序,我的目标是沿着“类型”列识别“连续性”;我会很高兴这样的事情:
type portion_ID
0 A A0
1 A A0
2 A A0
3 B B0
4 B B0
5 B B0
6 B B0
7 A A1
8 A A1
9 A A1
10 B B1
我想像
df['portion_ID'] = g['type'].apply(lambda s: s + some_magics())
会成功的,但我在任何地方都没有找到“some_magic()”:-)
提前致谢