0

我正在使用以下代码将带有连词的文本分块。但是我也希望添加“,”逗号字符。因此,每当文本面对连词或逗号之一时,它就会拆分文本。我怎样才能做到这一点?

import re
sent = 'food good and service bad'
result = re.split(r"\s+(?:but|and|because|,)\s+", sent)
4

1 回答 1

0

也许这就是你要找的东西?

import re
sent = 'food, good and service bad'
result = re.split(r"(?:\s+(?:but|and|because)\s+)|(?:\s*,\s*)", sent)

print(result)

印刷:

['food', 'good', 'service bad']
于 2020-08-14T08:40:13.253 回答