1

在 Python 内部字典中创建唯一键列表的更好方法

我的字典如下:

users3 = {"David": {"Imagine Dragons": 3, "Daft Punk": 5, "Lorde": 4, "Fall Out Boy": 1},
          "Matt": {"Imagine Dragons": 3, "Daft Punk": 4, "Lorde": 4, "Fall Out Boy": 1},
          "Ben": {"Kacey Musgraves": 4, "Imagine Dragons": 3, "Lorde": 3, "Fall Out Boy": 1},
          "Chris": {"Kacey Musgraves": 4, "Imagine Dragons": 4, "Daft Punk": 4, "Lorde": 3, "Fall Out Boy": 1},
          "Tori": {"Kacey Musgraves": 5, "Imagine Dragons": 4,"Daft Punk": 5, "Fall Out Boy": 3}}

(取自: http: //guidetodatamining.com/

我的目标是在内部字典中的键之间创建“基于项目的相似性”矩阵。我相信我必须首先在内部字典中生成唯一键列表,我已经使用以下脚本完成了它:

def masterOfTitle(users3):
    master_title = []
    for (users, ratings) in users3.items():
        for key in ratings.keys():
            if key not in master_title:
                master_title.append(key)
    return master_title

最后,结果符合预期:

>>> titles = masterOfTitle(users3)
>>> titles
['Daft Punk', 'Kacey Musgraves', 'Lorde', 'Fall Out Boy', 'Imagine Dragons']
>>> 

CMIIW,至少对我(作为一个新手)而言,Python 的编程逻辑/流程与我所学过的任何其他语言都有点不同(c、delphi/pascal、vb)是否有更好的方法使用理解表达式?请需要您的建议。

4

1 回答 1

1

使用集合来收集唯一键:

def masterOfTitle(users3):
    titles = set()
    for nested in users3.itervalues():
        titles.update(nested)
    return titles

如果你真的想要,你也可以使用集合理解:

def masterOfTitle(users3):
    return {title for nested in users3.itervalues() for title in nested}

您链接到的书似乎使用 Python 2 作为示例(它们用于codecs.open()unicode 编码/解码),因此我dict.itervalues()以最有效的方式迭代这些值。

演示:

>>> masterOfTitle(users3)
set(['Daft Punk', 'Fall Out Boy', 'Lorde', 'Kacey Musgraves', 'Imagine Dragons'])
于 2014-09-29T10:00:01.140 回答