0

我想更换

text = '2012-02-23 | My Photo Folder'

new_text = '20120223_MyPhotoFolder'

我在这里找到了一个与我的日期格式匹配的正则表达式 http://regexlib.com/RETester.aspx?regexp_id=933

解决这个问题的最佳方法是什么?我是否需要正则表达式组,然后在这些组中进行替换?

我假设我可以简单地搜索“|”并用普通 string.replace() 替换为“_”和“-”替换为“”,但我想找到一个更通用的解决方案。

提前致谢。

4

1 回答 1

2
import re

text = '2012-02-23 | My Photo Folder'

pattern = r'''
(?P<year>\d{4}) # year group consisting of 4 digits
-
(?P<month>\d{2}) # month group consisting of 2 digits
-
(?P<date>\d{2}) # date group consisting of 2 digits
\s\|\s
(?P<name_with_spaces>.*$) # name_with_spaces consuming the rest of the string to the end
'''
compiled = re.compile(pattern, re.VERBOSE)
result = compiled.match(text)
print('{}{}{}_{}'.format(
    result.group('year'),
    result.group('month'),
    result.group('date'),
    result.group('name_with_spaces').translate(None,' ')))

输出:

>>> 
20120223_MyPhotoFolder

一点解释:

re.VERBOSE让我们在多行中编写正则表达式,使其更具可读性并允许注释。

'{}{}{}_{}'.format只是一种字符串插值方法,它将参数放在{}.

translate方法应用于result.group('name_with_spaces')删除空格。

于 2013-04-02T14:19:52.150 回答