我很抱歉发布这个,但我已经浪费了很多时间来解决这个问题。因此,一个正则表达式 + Python 挑战是一个和所有的:
我正在处理大多数定期格式化的数据。公司列表组合成一个字符串,如
`Company Inc,Company, LLC,Company`
没有引号来描述条目。使用上面的常规示例,我可以执行以下操作:
>>> re.split(r',\b', 'Company Inc,Company, LLC,Company')
['Company Inc', 'Company, LLC', 'Company']
不幸的是,一些字符串的格式不规则,例如:
`IBP, Inc,Tyson Foods,Inc.`
其中不被空格,Inc
隔开。Foods
所以,使用r',\b'
,我得到这个:
>>> re.split(r',\b', 'IBP, Inc,Tyson Foods,Inc.')
['IBP, Inc', 'Tyson Foods', 'Inc.']
我想得到这个:
['IBP, Inc', 'Tyson Foods,Inc.']
在这个情况下,你会怎么做?