12

在 Python 3 中连接序列的首选方法是什么?

现在,我正在做:

import functools
import operator

def concatenate(sequences):
    return functools.reduce(operator.add, sequences)

print(concatenate([['spam', 'eggs'], ['ham']]))
# ['spam', 'eggs', 'ham']

需要导入两个单独的模块来执行此操作似乎很笨重。

一种替代方法可能是:

def concatenate(sequences):
    concatenated_sequence = []
    for sequence in sequences:
        concatenated_sequence += sequence
    return concatenated_sequence

但是,这是不正确的,因为您不知道序列是列表。

你可以这样做:

import copy

def concatenate(sequences):
    head, *tail = sequences
    concatenated_sequence = copy.copy(head)
    for sequence in sequences:
        concatenated_sequence += sequence
    return concatenated_sequence

但这似乎很容易出错——直接调用复制?(我知道head.copy()适用于列表和元组,但copy不是序列 ABC 的一部分,所以你不能依赖它......如果你得到字符串怎么办?)。您必须复制以防止突变,以防您收到MutableSequence. 此外,此解决方案会强制您首先解压缩整个序列集。再试一次:

import copy 

def concatenate(sequences):
    iterable = iter(sequences)
    head = next(iterable)
    concatenated_sequence = copy.copy(head)
    for sequence in iterable:
        concatenated_sequence += sequence
    return concatenated_sequence

但是来吧……这是蟒蛇!那么......这样做的首选方法是什么?

4

3 回答 3

12

我会itertools.chain.from_iterable()改用:

import itertools

def chained(sequences):
    return itertools.chain.from_iterable(sequences):

或者,由于您使用标记了它,您可以使用新yield from语法(看 ma,没有导入!):

def chained(sequences):
    for seq in sequences:
        yield from seq

两者都返回迭代器(list()如果您必须实现完整列表,请使用它们)。大多数情况下,您不需要从连接的序列中构造一个全新的序列,实际上,您只想循环它们以处理和/或搜索某些东西。

请注意,对于字符串,您应该使用str.join()我的回答或您的问题中描述的任何技术来代替:

concatenated = ''.join(sequence_of_strings)

结合起来,为了快速正确地处理序列,我会使用:

def chained(sequences):
    for seq in sequences:
        yield from seq

def concatenate(sequences):
    sequences = iter(sequences)
    first = next(sequences)
    if hasattr(first, 'join'):
        return first + ''.join(sequences)
    return first + type(first)(chained(sequences))

这适用于元组、列表和字符串:

>>> concatenate(['abcd', 'efgh', 'ijkl'])
'abcdefghijkl'
>>> concatenate([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
[1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> concatenate([(1, 2, 3), (4, 5, 6), (7, 8, 9)])
(1, 2, 3, 4, 5, 6, 7, 8, 9)

并使用更快''.join()的字符串序列。

于 2013-01-15T16:35:45.103 回答
2

出什么问题了:

from itertools import chain
def chain_sequences(*sequences):
  return chain(*sequences)
于 2018-07-20T00:57:48.403 回答
1

使用itertools.chain.from_iterable.

import itertools

def concatenate(sequences):
    return list(itertools.chain.from_iterable(sequences))

仅当您需要一个实际的新列表时才需要调用 to list,因此如果您只迭代此新序列一次,请跳过它。

于 2013-01-15T16:34:40.013 回答