这是我当前的正则表达式:[^\s][\.,\?!:][\w]. 我需要检查每个标点符号后是否有空格,例如[.,!:?]. 但是我有一个问题,我要签入的文件类型是*.sgm,所以有一些标签是这样的:
<at.cit><at.cit>> </at.cit> <case.cit><lit> </lit></case.cit>
例如:
<ptext>Text.Text<at.cit>Text</at.cit></ptext>
所以我只需要匹配"t.T",因为我们在句号之后需要一个空格。但我的正则表达式会找到"t.T"and"t.c"和"t.c"。我怎样才能消除这些标签?
感谢你的帮助。