我有以下一组字符串:
*H。NGUYEN1, J. SATZ2,3,4,5, R. TURK2,3,4,5, K. CAMPBELL2,3,4,5, S. MOORE1
1Pathology, 2Mol. 生理学。和生物物理学,3Neurol.,4Intrnl。医学,大学。爱荷华州爱荷华州爱荷华州;5霍华德休斯医学。Inst.,爱荷华城,IA
预期的输出是:
1) *H。NGUYEN1, J. SATZ2,3,4,5, R. TURK2,3,4,5, K. CAMPBELL2,3,4,5, S. MOORE1
2) 1Pathology, 2Mol. 生理学。和生物物理学,3Neurol.,4Intrnl。医学,大学。爱荷华州爱荷华州爱荷华州;5霍华德休斯医学。Inst.,爱荷华城,IA
上面的字符串是作者姓名和地址的组合。
有时,字符串在名称结尾后包含 (;),即S. MOORE1;有时不是,即S. MOORE1
我尝试了下面的正则表达式,但没有给出预期的结果。请帮助我,因为我是 Regex 的学习者。
;?[\d*]\w+
模式是:
单词后跟数字后跟分号或空格后跟数字后跟单词。例如:S. MOORE1(; Or Space)1Pathology。需要将线分割为 S.MOORE1 和 1Pathology
谢谢