11

相对的python新手在这里。我有一个无法修改的程序输出的文本字符串。为了讨论让我们说:

text = "This text . Is to test . How it works ! Will it! Or won't it ? Hmm ?"

我想删除标点符号前的空格,但不删除第二个空格。我一直在尝试使用正则表达式来做到这一点,并且我知道我可以使用 match='\s[\?.!\"]\s' 作为我的搜索词来匹配我想要的实例。

x=re.search('\s[\?\.\!\"]\s',text)

有没有办法用 re.sub 替换搜索词并删除前导空格?关于如何进行的任何想法?

4

2 回答 2

15

在要保留的文本周围放置一个组,并在替换模式中按编号引用该组:

re.sub(r'\s([?.!"](?:\s|$))', r'\1', text)

请注意,我使用r''原始字符串以避免使用太多反斜杠;但是,您不需要添加这么多。

我还调整了以下空间的匹配;它现在匹配空格或字符串的结尾。

演示:

>>> import re
>>> text = "This text . Is to test . How it works ! Will it! Or won't it ? Hmm ?"
>>> re.sub(r'\s([?.!"](?:\s|$))', r'\1', text)
"This text. Is to test. How it works! Will it! Or won't it? Hmm?"
于 2013-09-18T17:49:46.027 回答
5

使用re.sub而不是re.search.

>>> text = "This text . Is to test . How it works ! Will it! Or won't it ? Hmm ?"
>>> re.sub(r'\s+([?.!"])', r'\1', text)
"This text. Is to test. How it works! Will it! Or won't it? Hmm?"

你不需要在里面转义?, ., !,因为特殊字符在里面失去了意义。"[][]

于 2013-09-18T17:49:17.500 回答