3

我在 Python 中有 2 个具有这种格式的嵌套字典:

1166869: {'probL2': '0.000', 'probL1': '0.000', 'pronNDiff_site': '1.000', 'StateBin': '0', 'chr': 'chrX', 'rangehist': '59254000-59255000', 'start_bin': '59254000', 'countL2': '4', 'countL1': '0'} 

1166870: {'probL2': '0.148', 'probL1': '0.000', 'pronNDiff_site': '0.851', 'StateBin': '0', 'chr': 'chr2', 'rangehist': '59254000-59255000', 'start_bin': '59255000', 'countL2': '5', 'countL1': '15'} 

1166871: {'probL2': '0.000', 'probL1': '0.000', 'pronNDiff_site': '1.000', 'StateBin': '0', 'chr': 'chrY', 'rangehist': '59290000-59291000', 'start_bin': '59290000', 'countL2': '1', 'countL1': '2'}

其中 1166869、1166870 和 1166871 代表我从中读取数据的文件中的一行,其余键是数据本身。

现在我想创建一个列表,将所有不同的值存储在键“chr”中,因为有一些重复的值。

我怎样才能浏览字典并在两个值之间进行比较?此代码不起作用:

for k in range(len(file_dict)):
    for j in range(len(file_dict)-1):
        if (file_dict[j]["chr"] != file_dict[k]["chr"]):
            list_chr.append(file_dict[j]["chr"])
4

2 回答 2

7

使用一套,一次性使用所有物品:

chr = { v['chr'] for v in file_dict.itervalues() }

这使用集合理解在一行代码中生成您的集合。

集合推导是在 Python 2.7 中引入的;在早期版本中使用:

chr = set(v['chr'] for v in file_dict.itervalues())

在 Python 3 中,您需要替换.itervalues().values().

您自己的代码不起作用,因为 python 字典不是列表;您不是按索引检索值,而是按键检索值。您必须将其更改为:

for key in file_dict:
    for other_key in file_dict:
        if key == other_key:
            continue

        if file_dict[key]['chr'] != file_dict[otherkey]['chr']:
            list_chr.append(filed_dict[key]['chr'])

但这确实效率低下,更不用说不正确了。

于 2012-12-07T11:16:25.420 回答
1

怎么样?

list_chr = list(set([val['chr'] for val in file_dict.values()]))

这是如何运作的?

首先,列表理解获取内部 dict 中的所有 chr 条目,然后将这些条目转换为一个集合,这样就没有重复的条目,如果这是您喜欢的格式,这些条目将被转换为列表

请注意,也许你真的想使用一个集合,那么查找时间是 O(1) 而不是 O(n)

于 2012-12-07T11:33:42.603 回答