我有一个逗号分隔的文本文件。每行的第 5 个字段包含姓名和地址信息。名称与街道信息之间用“¬”字符分隔。相同的字符也分隔 city|state|zip。示例字段为:
“¬BOL¬MICKEY M MOUSE¬123 TOMORROW LANE¬ORLANDO FL 12345-6789¬¬¬EOL¬”
我需要将名称分成几部分,将 city|state|zip 分成几部分。但是,名称可能有也可能没有中间名首字母,因此:
m = l[4].split("¬")
firstName, mi, lastName = m[2].split()
如果没有中间首字母,将无法使用。此外,城市名称可能有空格,也可能没有空格:
city, state, zipCode = m[4].split()
例如,如果城市是“圣安东尼奥”或“里约热内卢”,则无法使用。
底线,我如何解析一个字段的部分,其中部分的格式并不总是相同?