1

我是 Python 新手,并尝试使用 re.sub 或其他方法在列表中查找单个项目并替换为多个项目。例如:

import re
list = ['abc', 'def']
tolist = []
for item in list:
    a = re.sub(r'^(.)(.)(.)$', '\\1\\2', '\\2\\3', item)
    tolist.append(a)
print tolist  # want: ['ab', 'bc', 'de', 'ef']

'\1\2', '\2\3' 部分显然不起作用,只是为了简单地说明这个想法。

4

3 回答 3

1

您可以在没有正则表达式的情况下配对字符:

lst = ['abc', 'def']
result = [a+b for chars in lst for a, b in zip(chars, chars[1:])]
print(result)
# -> ['ab', 'bc', 'de', 'ef']
于 2013-03-13T10:06:57.783 回答
0

这是一种相当通用的方法,您可以在其中列出要对每个项目进行的所有替换的元组:

In [1]: import re

In [2]: subs = [(r'^(.)(.)(.)$', r'\1\2'), (r'^(.)(.)(.)$', r'\2\3')]

In [3]: inlist = ['abc', 'def']

In [4]: [re.sub(*sub, string=s) for s in inlist for sub in subs]
Out[4]: ['ab', 'bc', 'de', 'ef']

每个元组中的第二个元素也可以是一个函数,因为re.sub它允许。我重命名了您的初始列表,因为list它是一个内置类型名称,不应该用于变量。

于 2013-03-13T09:12:40.033 回答
0
>>> res = []
>>> m = re.compile('(..)')
>>> for items in list:
...   for p in range(0,len(items)):
...     r = m.search(items[p:])
...     if r != None:
...        res.append(r.group())

制作一个匹配两个字符并将它们分组的正则表达式

第一个for循环,迭代列表

第二个for循环,每个列表项中的字符索引

搜索从偏移量开始的字符对

存储找到的任何东西

于 2013-03-13T09:19:59.723 回答