1

我有一个字典,在多个键下有多个值。我不想要单个值的总和。我想找到一种方法来找到每个键的总和。该文件是制表符分隔的,标识符是其中两项的组合,Btarg。每个标识符都有多个值。
这是一个测试文件: 这是一个测试文件,所需的结果如下:

图案项目丰度

1 蚂蚁 2

2 狗 10

3 长颈鹿 15

1 蚂蚁 4

2 狗 5

这是预期的结果:

图案1蚂蚁,6

图案2狗,15

Pattern3长颈鹿,15

这是我到目前为止所拥有的:

for line in K:

    if "pattern" in line:
        find = line
        Bsplit = find.split("\t")
        Buid = Bsplit[0]
        Borg = Bsplit[1]
        Bnum = (Bsplit[2])
        Btarg = Buid[:-1] + "//" + Borg


        if Btarg not in dict1:
            dict1[Btarg] = []
        dict1[Btarg].append(Bnum)
    #The following used to work
    #for key in dict1.iterkeys():
        #dict1[key] = sum(dict1[key])
    #print (dict1)

如何在 Python 3 中完成这项工作而不会出现错误消息“+: 'int' 和 'list' 不支持的操作数类型?提前致谢!

4

1 回答 1

1

利用from collections import Counter

文档中:

c = Counter('gallahad')
Counter({'a': 3, 'l': 2, 'h': 1, 'g': 1, 'd': 1})

回应你的评论,现在我想我知道你想要什么,虽然我不知道你的数据在什么结构中。我会理所当然地认为你可以像这样组织你的数据:

In [41]: d
Out[41]: [{'Ant': 2}, {'Dog': 10}, {'Giraffe': 15}, {'Ant': 4}, {'Dog': 5}]

首先创建一个defaultdict

from collections import defaultdict
a = defaultdict(int)

然后开始计算:

In [42]: for each in d:
            a[each.keys()[0]] += each.values()[0]

结果:

In [43]: a
Out[43]: defaultdict(<type 'int'>, {'Ant': 6, 'Giraffe': 15, 'Dog': 15})

更新 2

假设您可以以这种格式获取数据:

In [20]: d
Out[20]: [{'Ant': [2, 4]}, {'Dog': [10, 5]}, {'Giraffe': [15]}]

In [21]: from collections import defaultdict

In [22]: a = defaultdict(int)

In [23]: for each in d:
    a[each.keys()[0]] =sum(each.values()[0])
   ....:     

In [24]: a
Out[24]: defaultdict(<type 'int'>, {'Ant': 6, 'Giraffe': 15, 'Dog': 15})
于 2012-10-26T20:01:41.043 回答