0

我有一个 python 脚本,它解析一个.txt文件并生成一个列表,如下所示:

['test=testTC101', 'test=testTC101', 'test=testTC102', 'test=testTC102', 'test=testTC103', 'test=testTC103', 'test=testTC104', 'test=testTC104', 'test=testTC105', 'test=testTC105', 'test=testTC106', 'test=testTC106', 'test=testTC107', 'test=testTC107']

我需要消除重复项。我怎样才能做到这一点?

4

2 回答 2

3

只需使用set

>>> x = ['test=testTC101', 'test=testTC101', 'test=testTC102', 'test=testTC102', 
...      'test=testTC103', 'test=testTC103', 'test=testTC104', 'test=testTC104', 
...      'test=testTC105', 'test=testTC105', 'test=testTC106', 'test=testTC106', 
...      'test=testTC107', 'test=testTC107']
>>> set(x)
set(['test=testTC101', 'test=testTC103', 'test=testTC102', 'test=testTC105', 
'test=testTC104', 'test=testTC107', 'test=testTC106'])
>>>

然后,您始终可以使用以下命令将其重新添加到列表中list

>>> list(set(x))
['test=testTC101', 'test=testTC103', 'test=testTC102', 'test=testTC105', 
'test=testTC104', 'test=testTC107', 'test=testTC106']
>>> # You can also use sorted to order the items
>>> sorted(list(set(x)))
['test=testTC101', 'test=testTC102', 'test=testTC103', 'test=testTC104', 
'test=testTC105', 'test=testTC106', 'test=testTC107']
>>>

集合保证没有重复。

于 2013-09-24T20:46:40.577 回答
1

如果您碰巧要求保留该订单:

def best_case_iteruniq(iterable, key=None):
    memo_hash = set()
    memo_else = list()

    add_hash = memo_hash.add
    add_else = memo_else.append

    if key is None:
        def predicate(item):
            try:
                hash(item)

            except TypeError:
                if item in memo_else:
                    return False

                add_else(item)
                return True

            else:
                if item in memo_hash:
                    return False

                add_hash(item)
                return True


    else:
        def predicate(actual_item):
            item = key(actual_item)

            try:
                hash(item)

            except TypeError:
                if item in memo_else:
                    return False

                add_else(item)
                return True

            else:
                if item in memo_hash:
                    return False

                add_hash(item)
                return True

    return filter(predicate, iterable)

这是我前段时间制作的一个小工具,它允许您在尽可能短的时间内将可散列和不可散列元素的列表唯一化(假设没有完全排序的不可散列元素),它还允许key使它们唯一化。

不过,对于这种情况,这几乎肯定是矫枉过正。但它就在那里,而且是免费的。

于 2013-09-24T20:58:55.573 回答