我正在尝试将不以特定字符('[')开头的行连接到以它开头的最近行。我已阅读txt文件如下:
,
我希望得到
.
您可以使用str[0]
检查第一个字符,然后cumsum
标记块:
df['text'].groupby(df['text'].str[0].eq('[').cumsum()).agg(' '.join)
输出:
text
1 [aaa] sss
2 [bbb] mmm fff ppp
3 [iii] rrr qqq
4 [ggg] kkk
Name: text, dtype: object
让我们做
s=df.groupby(df.text.str.startswith('[').cumsum()).agg(' ',join)