我有以下西班牙语句子。
Oye , si te parece quedamos en El Corte Inglés de Nuevos Ministerios este martes , a las 18:30 , y me ayudas con las compras , te parece los sofás no sé si comprarlos en Zara Home o en la web , que es http:/ /zara-home.es。De todas maneras , dame un toque al +00 000 000 000 y lo hablamos。Te dejo también mi correo ,用户名@domain .com。文加,hasta luego。
从这句话中,我想删除“单词和逗号”和“单词和句号”之间的空格。我正在使用以下代码来完成这项工作。它适用于大多数其他句子,但不适用于上述句子。
sentence = 'Oye , si te parece quedamos en El Corte Inglés de Nuevos Ministerios este martes , a las 18:30 , y me ayudas con las compras , te parece los sofás no sé si comprarlos en Zara Home o en la web , que es http://zara-home.es . De todas maneras , dame un toque al +00 000 000 000 y lo hablamos. Te dejo también mi correo , username@domain .com. Venga , hasta luego.'
full_stop = re.compile(u"(?<=\s)([\w\d\@\-\:\/\.]+\s[\.,])", re.UNICODE)
words_changed = ["".join(full_stops.split()) for full_stops in full_stop.findall(sentence)]
for i,words in enumerate(full_stop.findall(sentence)):
words = re.sub('\s.','\s\.',words, flags=re.UNICODE)
sentence = re.sub(words, words_changed[i], sentence, flags=re.UNICODE)
print sentence
为什么 re.sub 并不总是像在 python 中那样起作用?