python - 删除 Python 列表中几乎重复的元素，同时保留变量

Question

我有一个列表，其中包含几乎重复的元素，但标识该元素的数字除外。我想删除所有重复项，同时保留包含重复项的第一个元素的编号。

例如，我想替换l为lnew：

l = ['iter1apple','iter2banana','iter3carrot','iter4apple','iter5orange','iter6banana','iter7mango']

lnew = ['iter1apple','iter2banana','iter3carrot','iter5orange','iter7mango']

我猜这与从列表元素的其余部分拆分数字、将列表转换为设置并defaultdict与拆分中的元素一起使用有关，但我不知道如何。

任何建议，将不胜感激。

score 1 · Accepted Answer

如果我对您的理解正确，您想丢弃以一个已包含在列表中的元素结尾的项目。在这种情况下，您可以使用正则表达式和列表来跟踪已使用的元素：

import re

l = ['iter1apple', 'iter2banana', 'iter3carrot', 'iter4apple', 'iter5orange', 'iter6banana', 'iter7mango']
duplicates = []
lnew = []
for item in l:
    match = re.match("^iter\d+(\w+)$", item)
    if match and not match.group(1) in duplicates:
        duplicates.append(match.group(1))
        lnew.append(item)

# lnew = ['iter1apple','iter2banana','iter3carrot','iter5orange','iter7mango']

python - 删除 Python 列表中几乎重复的元素，同时保留变量

1 回答 1

Related

Reference