1

我有一本像这样的字典:

a = {'date' : ['2012-03-09', '2012-01-12', '2012-11-11'],
     'rate' : ['199', '900', '899'],
     'country code' : ['1', '2', '44'],
     'area code' : ['114', '11', '19'],
     'product' : ['Mobile', 'Teddy', 'Handbag']}

然后我使用 zip 函数来连接这些值:

data = [(a,b,c+d,e) for a,b,c,d,e in zip(*a.values())]

输出:

data = [('2012-03-09', '199', '1114', 'Mobile'),
        ('2012-01-12', '900', '211', 'Teddy'),
        ('2012-11-11', '899', '4419', 'Handbag')]

如果我想让函数自己搜索“国家代码”和“区号”,然后合并它们怎么办。请问有什么建议吗?

4

2 回答 2

3

一种合并“列”的通用方法,可让您指定预期的列以及预先合并的内容:

def merged_pivot(data, *output_names, **merged_columns):
    input_names = []
    column_map = {}
    for col in output_names:
        start = len(input_names)
        input_names.extend(merged_columns.get(col, [col]))
        column_map[col] = slice(start, len(input_names))
    for row in zip(*(data[c] for c in input_names)):
        yield tuple(''.join(row[column_map[c]]) for c in output_names)

你打电话给:

list(merged_pivot(a, 'date', 'rate', 'code', 'product', code=('country code', 'area code')))

传入:

  • 映射列表
  • 构成输出的每一列('date', 'rate', 'code', 'product'在上面的例子中)
  • 输出中由输入列的合并列表组成的任何列(code=('country code', 'area code')在示例中,code输出中由合并country code和形成area code)。

输出:

>>> list(merged_pivot(a, 'date', 'rate', 'code', 'product', code=('country code', 'area code')))
[('2012-03-09', '199', '1114', 'Mobile'), ('2012-01-12', '900', '211', 'Teddy'), ('2012-11-11', '899', '4419', 'Handbag')]

或者,稍微重新格式化:

[('2012-03-09', '199', '1114', 'Mobile'), 
 ('2012-01-12', '900', '211', 'Teddy'),
 ('2012-11-11', '899', '4419', 'Handbag')]

如果您需要做的只是分别处理每一行,您也可以只循环它的输出,而不是调用生成list()器:merged_pivot()

columns = ('date', 'rate', 'code', 'product')
for row in merged_pivot(a, *columns, code=('country code', 'area code')):
    # do something with `row`
    print row
于 2013-03-08T11:58:12.197 回答
2

您必须自己定义键的顺序(否则a.values以任意顺序返回)。我将您的原始字典重命名为dd

[(a,b,c+d,e) for a,b,c,d,e in zip(*(dd[k] for k in ('date', 'rate', 'country code', 'area code', 'product')))]

返回

[('2012-03-09', '199', '1114', 'Mobile'),
 ('2012-01-12', '900', '211', 'Teddy'),
 ('2012-11-11', '899', '4419', 'Handbag')]
于 2013-03-08T11:42:10.210 回答