是否有更 Pythonic(或简洁)的方法来防止将重复项添加到列表中?
if item not in item_list:
item_list.append(item)
或者这实际上是一种廉价的操作?
由于@hcwsha的原始解决方案已被替换,我在这里记录它:
seen = set(item_list)
# [...]
if item not in seen:
seen.add(item)
item_list.append(item)
这在O (1) 中运行,因此可以认为比您当前使用的更好。
你的方法很棒!Set 对这类事情很有用,但如前所述,它们不保持顺序。其他更简洁的写作方式,虽然可能不那么清楚,如下所示:
item_list.append(item) if item not in item_list else None
和
item_list += [item] if item not in item_list else []
new_items = [item1, ...]
如果您想像这样添加多个,可以调整最后一个
item_list += [item for item in new_items if item not in item_list]
使用 aset
来跟踪看到的项目,集合提供O(1)
lookup。
>>> item_list = [1, 7, 7, 7, 11, 14 ,100, 100, 4, 4, 4]
>>> seen = set()
>>> item_list[:] = [item for item in item_list
if item not in seen and not seen.add(item)]
>>> item_list
[1, 7, 11, 14, 100, 4]
如果顺序无关紧要,那么只需使用set()
on item_list
:
>>> set(item_list)
set([1, 100, 7, 11, 14, 4])
如果您有多个附加到集合的位置,那么编写样板代码不是很方便if item not in item_list:....
,您应该有一个单独的函数来跟踪对集合或子类列表的更改,并使用“追加”方法覆盖:
class CollisionsList(list):
def append(self, other):
if other in self:
raise ValueError('--> Value already added: {0}'.format(other))
super().append(other)
l = CollisionsList()
l.append('a')
l.append('b')
l.append('a')
print(l)
set()
您可以使用如下所示的内置函数以及list()
将该集合对象转换为普通 python 列表的函数:
item_list = ['a','b','b']
print list(set(item_list))
#['a', 'b']
注意:使用集合时不保持顺序
当您在列表中有对象并且需要检查某个属性以查看它是否已经在列表中时。
并不是说这是最好的解决方案,但它确实有效:
def _extend_object_list_prevent_duplicates(list_to_extend, sequence_to_add, unique_attr):
"""
Extends list_to_extend with sequence_to_add (of objects), preventing duplicate values. Uses unique_attr to distinguish between objects.
"""
objects_currently_in_list = {getattr(obj, unique_attr) for obj in list_to_extend}
for obj_to_add in sequence_to_add:
obj_identifier = getattr(obj_to_add, unique_attr)
if obj_identifier not in objects_currently_in_list:
list_to_extend.append(obj_to_add)
return list_to_extend