我有以下数据:
data = [['AB', 'BS, BT'], ['AH', 'AH'], ['AS', 'AS, GS']]
我想遍历列表列表以生成元组列表。
new_data = [('AB', 'BS'), ('AB', 'BT'), ('AH', 'AH'), ('AS', 'AS') ('AS', 'GS')]
我正在考虑使用 zip() 函数,但不确定我是否使用了正确的逻辑。
zip
不会是我的第一选择。itertools.product
我的第一选择是itertools.chain
In [103]: data = [['AB', 'BS, BT'], ['AH', 'AH'], ['AS', 'AS, GS']]
In [104]: [list(itertools.product([d[0]], d[1].split(','))) for d in data]
Out[104]: [[('AB', 'BS'), ('AB', ' BT')], [('AH', 'AH')], [('AS', 'AS'), ('AS', ' GS')]]
In [105]: list(itertools.chain.from_iterable([list(itertools.product([d[0]], d[1].split(','))) for d in data]))
Out[105]: [('AB', 'BS'), ('AB', ' BT'), ('AH', 'AH'), ('AS', 'AS'), ('AS', ' GS')]
希望这可以帮助
这可以很容易地用itertools.repeat()
. 我们使用它来为每个其他项目重复第一个项目,我们通过拆分来获得它","
,然后拉上拉链以生成我们的元组。然后我们用它itertools.chain.from_iterable()
来生成一个列表。
>>> import itertools
>>> data = [['AB', 'BS, BT'], ['AH', 'AH'], ['AS', 'AS, GS']]
>>> for item in itertools.chain.from_iterable(zip(itertools.repeat(first), second.split(",")) for first, second in data):
... print(item)
...
('AB', 'BS')
('AB', ' BT')
('AH', 'AH')
('AS', 'AS')
('AS', ' GS')
使用zip()
:
In [32]: data
Out[32]: [['AB', 'BS, BT'], ['AH', 'AH'], ['AS', 'AS, GS']]
In [33]: [zip([x[0]]*len(x[1].split(",")),x[1].split(",")) for x in data]
Out[33]: [[('AB', 'BS'), ('AB', ' BT')], [('AH', 'AH')], [('AS', 'AS'), ('AS', ' GS')]]
用于chain()
获得预期的输出:
In [34]: lis=[zip([x[0]]*len(x[1].split(",")),x[1].split(",")) for x in data]
In [35]: list(chain(*lis))
Out[35]: [('AB', 'BS'), ('AB', ' BT'), ('AH', 'AH'), ('AS', 'AS'), ('AS', ' GS')]
使用izip_longest
,fillvalue
等于每个子列表的第一个元素:
In [47]: from itertools import chain,izip_longest
In [48]: lis=[tuple(izip_longest([x[0]],x[1].split(","),fillvalue=x[0])) for x in data]
In [49]: lis
Out[49]: [(('AB', 'BS'), ('AB', ' BT')), (('AH', 'AH'),), (('AS', 'AS'), ('AS', ' GS'))]
In [50]: list(chain(*lis))
Out[50]: [('AB', 'BS'), ('AB', ' BT'), ('AH', 'AH'), ('AS', 'AS'), ('AS', ' GS')]