我遇到了以下 python 脚本的问题,该脚本从公司内部 Web 应用程序文本区域中的文本中提取一些选项。
import re
text = 'option one\noption two, option three, option four'
correct = 'option one, option two, option three, option four'
pattern = re.compile('(\s*[,]\s*)')
fixed = pattern.sub(', ', text)
print fixed
option one
option two, option three, option four
print fixed.split(', ')
['option one\noption two', 'option three', 'option four']
这显然无法将“选项一\n选项二”拆分为“选项一”、“选项二”
所以输入可能最终为
option one
option two, option three, option four
这将需要转换为
option one, option two, option three, option four
如果是逗号,它可以正常工作
或者
逗号后跟换行符
但如果它本身只是一个换行符,则不是。