1

我正在尝试将不以特定字符('[')开头的行连接到以它开头的最近行。我已阅读txt文件如下:

开始 df,

我希望得到

结束df.

4

2 回答 2

0

您可以使用str[0]检查第一个字符,然后cumsum标记块:

df['text'].groupby(df['text'].str[0].eq('[').cumsum()).agg(' '.join)

输出:

text
1            [aaa] sss
2    [bbb] mmm fff ppp
3        [iii] rrr qqq
4            [ggg] kkk
Name: text, dtype: object
于 2020-05-06T02:37:10.953 回答
0

让我们做

s=df.groupby(df.text.str.startswith('[').cumsum()).agg(' ',join)
于 2020-05-06T02:35:13.330 回答