python - 以pythonic方式从制表符分隔文件构建字典

Question

我编写了以下函数，它接受一个制表符分隔的文件（作为一个字符串）并将其转换为一个字典，其中一个整数作为键，一个包含两个浮点数和值的列表：

def parseResults(self, results):
    """
    Build a dictionary of the SKU (as key), current UK price and current Euro price
    """
    lines = results.split('\n')
    individual_results = []
    for i in range(1,len(lines)-1):
        individual_results.append(lines[i].split('\t'))
    results_dictionary = {}
    for i in range(len(individual_results)):
        results_dictionary[int(individual_results[i][0])] = [float(individual_results[i][1]), float(individual_results[i][2])]
    return results_dictionary

我一直在阅读有关使用列表理解和字典理解的内容，但我真的不知道构建它的最佳方法是什么。

我想我可以使用以下方法简化第一个列表构建：

individual_results = [results.split('\t') for results in lines[1:]]

但我不知道创建字典的最佳方法。我觉得这可能以一种简洁的方式实现，甚至无需创建中间列表。

谢谢，

马特

score 6 · Accepted Answer

像这样：

import csv
import StringIO
results = "sku\tdelivered-price-gbp\tdelivered-price-euro\tid\n32850238\t15.53\t35.38\t258505\n"

data = list(csv.DictReader(StringIO.StringIO(results), delimiter='\t'))
print(data)

输出：

[{'sku': '32850238', 'delivered-price-euro': '35.38', 'delivered-price-gbp': '15.53', 'id': '258505'}]

当然，如果您可以从实际文件中读取，则可以跳过 stringIO 部分。

要构建您想要的字典类型，您可以这样做：

data = {}
for entry in csv.DictReader(StringIO.StringIO(results), delimiter='\t'):
    data[entry['sku']] = [entry['delivered-price-gbp'], entry['delivered-price-euro']]

甚至作为字典理解：

import csv
import StringIO
results = "sku\tdelivered-price-gbp\tdelivered-price-euro\tid\n32850238\t15.53\t35.38\t258505\n10395850\t35.21\t46.32\t3240582\n"

data = {entry['sku']: [entry['delivered-price-gbp'], entry['delivered-price-euro']] 
        for entry in csv.DictReader(StringIO.StringIO(results), delimiter='\t')}
print(data)

但现在阅读起来变得非常困难。

在最后两种情况下，输出将是：

{'32850238': ['15.53', '35.38'], '10395850': ['35.21', '46.32']}

score 1 · Accepted Answer

1

使用标准库中的 CSV 模块，它具有直接读取字典 csv.DictReader的方法

于 2013-04-27T11:31:56.713 回答

score 0 · Accepted Answer

尝试这样的事情：

In [8]: from collections import defaultdict

In [9]: with open("filename") as f:
   ...:     dic=defaultdict(list)
   ...:     next(f)                #skip the first line 
   ...:     for line in f:
   ...:         k,v=line.split(None,1)
   ...:         dic[int(k)].extend( map(float,v.split()[:2]) )
   ...:         

In [10]: dic
Out[10]: defaultdict(<type 'list'>, {32850238: [15.53, 35.38]})

score 0 · Accepted Answer

您的代码可以简单地是：

def parseResults(self, results):  
    lines = results.split('\n')
    li_results = [x.split('\t') for x in lines]
    results_dict = {int(x[0]):map(float,[x[1],x[2]]) for x in li_results[1:]} # skip the header
    return results_dict

或者如果你想要它更短（不推荐）：

def parseResults(self, results):
    return {int(x[0]):map(float,[x[1],x[2]]) for x in [i.split('\t') for i in results.split('\n')][1:]}

输出（来自您给出的字符串）：

{32850238: [15.53, 35.38]}

python - 以pythonic方式从制表符分隔文件构建字典

4 回答 4

Related

Reference