2

在 Python(也使用 numpy)中,我有一个列表列表,每个列表的长度不同。

[
    [
         ["header1","header2"],
         ["---"],
         [],
         ["item1","value1"]
    ],

    [
         ["header1","header2","header3"],
         ["item2","value2"],
         ["item3","value3","value4","value5"]
    ]
]

我想使这个数据结构矩形:即保证len(list[x])对所有都是常数,对所有 x xlen(list[x][y])y 等都是常数。

(这是因为我想将数据结构导入numpy)

我可以想到各种非pythonic的方法来做这样的事情(迭代结构,记录每个级别的最大长度,有第二遍和填充值None,但必须有更好的方法。

(我也希望解决方案不依赖于结构的维度;即它也应该适用于此类结构的列表......)

有没有一种我想念的简单方法?

4

1 回答 1

1

您可以创建ndarray具有所需尺寸的列表并轻松阅读您的列表。由于您的列表不完整,您必须捕获IndexError,这可以在一个try / exception块中完成。

使用numpy.ndenumerate允许解决方案可以轻松扩展到更多维度(i,j,k,l,m,n,...在下面的 for 循环中添加更多索引):

import numpy as np
test = [ [ ["header1","header2"],
           ["---"],
           [],
           ["item1","value1"] ],
         [ ["header1","header2","header3"],
           ["item2","value2"],
           ["item3","value3","value4","value5"] ] ]


collector = np.empty((2,4,4),dtype='|S20')

for (i,j,k), v in np.ndenumerate( collector ):
    try:
        collector[i,j,k] = test[i][j][k]
    except IndexError:
        collector[i,j,k] = ''


print collector
#array([[['header1', 'header2', '', ''],
#        ['---', '', '', ''],
#        ['', '', '', ''],
#        ['item1', 'value1', '', '']],
#       [['header1', 'header2', 'header3', ''],
#        ['item2', 'value2', '', ''],
#        ['item3', 'value3', 'value4', 'value5'],
#        ['', '', '', '']]],  dtype='|S10')
于 2013-05-22T17:04:46.967 回答