2

我正在使用非规范化表,这在提取唯一信息时提供了一些挑战。如果表格被标准化:

unique_data = list({d['value'] for d in mydata})

会成功的。

但是表格没有标准化。

我可以创建一组 dict 然后我可以变成列表吗?类似的东西(这给了我一个错误):

unique_data_with_id = list({{'id':d['id'], 'value':d['value']} for d in mydata})
4

3 回答 3

5

字典是可变的,所以你不能把它们放在一个集合中。解决此问题的一种方法是使用 anamedtuple而不是字典:

IdValueTuple = collections.namedtuple("IdValueTuple", "id value")
unique_data_with_id = list({IdValueTuple(d["id"], d["value"]) for d in mydata})
于 2013-09-26T17:52:24.790 回答
0
{{'id':d['id'], 'value':d['value']} for d in mydata}

创建一个sets dict。因为dicts 是可变的,所以它们不是可散列的,并且集合需要可散列的元素。

请尝试tuple

{(d['id'], d['value']) for d in mydata}

请注意,我非常喜欢 Sven Marnach 在namedtuple这里使用的 a。

于 2013-09-26T17:53:19.540 回答
0

更多因为它在其他上下文中偶尔有用,您可以使用 afrozenset作为中间对象:

>>> pprint.pprint(mydata)
[{'id': 1, 'ignore': 92, 'value': 'a'},
 {'id': 2, 'ignore': 92, 'value': 'b'},
 {'id': 1, 'ignore': 92, 'value': 'a'}]
>>> keep_keys = "id", "value"
>>> [dict(s) for s in {frozenset((k, d[k]) for k in keep_keys) for d in mydata}]
[{'id': 1, 'value': 'a'}, {'id': 2, 'value': 'b'}]
于 2013-09-26T18:01:26.963 回答