0

我需要将元组列表中的项目与嵌套列表中的项目进行比较,并返回一个包含元组和嵌套列表中项目的列表。

输入数据:

data1 = [('Name1', {'code':['12345']}),
         ('Name2', {'code':['78901']})]

data2 = [['12345', '123456', 'name1'],
         ['78901', '789012', 'name2'],
         ['34567', '345678', 'name3']]

如果这使事情变得更容易,我将输入 data1 转换为匹配 data2 的嵌套列表格式没有问题。

我需要的是这样的:

data3 = [['Name1', '123456', 'name1']
         ['Name2', '789012', 'name2']]

基本上比较data1[x][1]['code'][0] to data2[x][0]

到目前为止我所拥有的,但我不确定它是否正确:

data3 = []
for i in range(len(data2)):
    if data1[i][1]['code'][0] in [data2][i][0]:
       data3.append([data1[i][0], data2[i][1], data2[i][2]])

这将返回一个IndexError: list index out of range

提前致谢。

4

2 回答 2

2

创建data1first 的逆映射:

inverse_data1 = {v['code'][0]: k for k, v in data1}

现在剩下的就简单多了;您可以针对该逆映射查看代码并在 O(1) 时间内找到相应的名称:

data3 = [[inverse_data1[d[0]]] + d[1:] for d in data2 if d[0] in inverse_data1]

演示:

>>> inverse_data1 = {v['code'][0]: k for k, v in data1}
>>> [[inverse_data1[d[0]]] + d[1:] for d in data2 if d[0] in inverse_data1]
[['Name1', '123456', 'name1'], ['Name2', '789012', 'name2']]

一般来说,range(len(somelist))当您可以直接循环列表时,不要循环。如果您需要一个用于其他目的的索引,您可以使用该enumerate()功能添加一个索引。您的data1data2列表长度不相等,因此您不能只使用在另一个上起作用的索引。

您的方法将需要嵌套循环(非常低效,您现在正在遍历整个data2for 每个条目data1):

data3 = []
for d1 in data1:
    for d2 in data2:
        if d1[1]['code'][0] == d2[0]:
            data3.append(d1[0] + d2[1:])
于 2013-07-26T11:07:36.877 回答
0

您的 data2 列表比 data1 长,并且您使用 data2 的长度迭代 data1,索引比它的多。[data2]if 语句中的括号内有一个错误。

修复原代码:

data3 = []
for i in range(len(data1)):
    for j in range(len(data2)):
        if data1[i][1]['code'][0] in data2[j][0]:
            data3.append([data1[i][0], data2[j][1], data2[j][2]])

通过直接迭代列表来简化:

data3 = []
for i in data1:
    for j in data2:
        if i[1]['code'][0] in j[0]:
            data3.append([i[0], j[1], j[2]])
于 2013-07-26T11:08:57.143 回答