这是我当前的正则表达式:[^\s][\.,\?!:][\w]
. 我需要检查每个标点符号后是否有空格,例如[.,!:?]
. 但是我有一个问题,我要签入的文件类型是*.sgm
,所以有一些标签是这样的:
<at.cit><at.cit>> </at.cit> <case.cit><lit> </lit></case.cit>
例如:
<ptext>Text.Text<at.cit>Text</at.cit></ptext>
所以我只需要匹配"t.T"
,因为我们在句号之后需要一个空格。但我的正则表达式会找到"t.T"
and"t.c"
和"t.c"
。我怎样才能消除这些标签?
感谢你的帮助。