0

我有这个代码:

cursor.execute( ''' SELECT id,DISTINCT tag
                     FROM userurltag ''')
tags = cursor.fetchall ()
T = [3,5,7,2,1,2,2,2,5,6,3,3,1,7,4] 

我有 7 个组名称 1,...,7 。“tags”列表中的每一行对应“T”列表中的一行。“T”的值表示例如“tags”列表中的第一行属于第3组,“tags”列表中的第二行属于第 5 组,以此类推。这些基本上是每个标签所属的集群。我想提取它们,方法是让每个组/集群都在一个单独的例如字典数据类型中。重要的是每次运行时集群的数量都会发生变化。所以我需要一个通用代码可以处理不同数量的集群来解决这个问题。我真的需要你的帮助谢谢。

4

1 回答 1

1
cluster_to_tag = defaultdict(list)
#May want to assert that length of tags and T is same
for tag,cluster in zip(tags, T):
    cluster_to_tag[cluster].append(tag)

#cluster_to_tag now maps cluster ti list of tags

hth

于 2010-05-21T16:51:09.273 回答