1

这是这样的 data.txt 文件:

{'wood', 'iron', 'gold', 'silver'}
{'tungsten', 'iron', 'gold', 'timber'}

我想得到两种类型的结果,如下所示:

#FIRST TYPE: sorted by item
gold: 33.3%
iron: 33.3%
silver: 16.7%
timber: 16.7%
tungsten: 16.7%

#SECOND TYPE: sorted by percentage
silver: 16.7%
timber: 16.7%
tungsten: 16.7%
gold: 33.3%
iron: 33.3%

我为此结果显示我的代码

import collections
counter = collections.Counter()

keywords = []
with open("data.txt") as f:
     for line in f:
         if line.strip():
             for keyword in line.split(','):
                 keywords.append(keyword.strip())
     counter.update(keywords)

     for key in counter:
         print "%s: %.1f%s" %(key, (counter[key]*1.0 / len(counter))*100, '%')

但是我的结果是这样的

'silver'}: 16.7%
'iron': 33.3%
....

我想摆脱大括号,结果中的撇号。

如何更改或重写以显示我想要的结果?我会等你的帮助!!

4

3 回答 3

2

字典/ Counters/ sets 没有排序。您必须首先将其转换为 alist并对列表进行排序。

例如:

for key, val in sorted(counter.items()):  #or with key=lambda x:x[0]
    print "%s: %.1f%s" % (key, float(val) * 100 / len(counter), "%")

打印按键排序的值,同时:

for key, val in sorted(counter.items(), key=lambda x: (x[1], x[0])):
    print "%s: %.1f%s" % (key, float(val) * 100 / len(counter), "%")

按百分比对它们进行排序(如果两个项目具有相同的百分比,它们也按名称排序)。

更新

关于您的解析问题,您还必须strip使用{and }

for line in f:
    if line.strip():
        for keyword in line.strip().strip('{}').split(','):
            keyword = keyword.strip("'")

如果您使用的是最新的 python 版本(如 2.7 和/或 3),您可以使用ast.literal_eval

import ast
...
for line inf f:
    stripped = line.strip()
    if stripped:
        for keyword in ast.literal_eval(stripped):

但是请注意,这将删除同一行上的重复键!(从您的示例来看,这似乎还可以...)

否则你可以这样做:

import ast
...
for line inf f:
    stripped = line.strip()
    if stripped:
        for keyword in ast.literal_eval('[' + stripped[1:-1] + ']'):

这将保留重复项。

于 2013-05-11T07:09:22.437 回答
1

{流浪的原因}是你没有摆脱它们。
为此,只需将您的 for 循环更改为:

 for line in f:
     line = line.strip().strip('{}') # get rid of curly braces
     if line:
         ....

就印刷而言:

print "Sorted by Percentage"
for k,v in sorted(c.items(), key=lambda x: x[1]):
    print '{0}: {1:.2%}'.format(k, float(v)/len(c))
print 
print "Sorted by Name"
for k,v in  sorted(c.items(), key=lambda x :x[0]):
    print '{0}: {1:.2%}'.format(k, float(v)/len(c))
于 2013-05-11T07:26:11.037 回答
1

用于sorted根据键/百分比对项目进行排序,因为 dicts 没有任何顺序。

from collections import Counter
counter = Counter()
import ast
keywords = []
with open("abc") as f:
    for line in f:
        #strip {} and split the line at ", " 
        line = line.strip("{}\n").split(", ")
        counter += Counter(x.strip('"') for x in line)

le = len(counter)    
for key,val in sorted(counter.items()):
    print "%s: %.1f%s" %(key, (val*1.0 / le)*100, '%')

print

for key,val in sorted(counter.items(), key = lambda x :(x[1],x[0]) ):
    print "%s: %.1f%s" %(key, (val*1.0 / le)*100, '%')

输出:

'gold': 33.3%
'iron': 33.3%
'silver': 16.7%
'timber': 16.7%
'tungsten': 16.7%
'wood': 16.7%

'silver': 16.7%
'timber': 16.7%
'tungsten': 16.7%
'wood': 16.7%
'gold': 33.3%
'iron': 33.3%
于 2013-05-11T07:12:02.470 回答