4

我编写了一些 python 代码,用于将 python 列表转换为 XML 元素。它用于与 LabVIEW 交互,因此是奇怪的 XML 数组格式。无论如何,这是代码:

def pack(data):
  # create the result element
  result = xml.Element("Array")

  # report the dimensions
  ref = data
  while isinstance(ref, list):
    xml.SubElement(result, "Dimsize").text = str(len(ref))
    ref = ref[0]

  # flatten the data
  while isinstance(data[0], list):
    data = sum(data, [])

  # pack the data
  for d in data:
    result.append(pack_simple(d))

  # return the result
  return result

现在我需要编写一个 unpack() 方法来将打包的 XML 数组转换回 python 列表。我可以很好地提取数组维度和数据:

def unpack(element):
  # retrieve the array dimensions and data
  lengths = []
  data = []
  for entry in element:
    if entry.text == "Dimsize":
      lengths.append(int(entry.text))

    else:
      data.append(unpack_simple(entry))

  # now what?

但我不确定如何展平阵列。什么是这样做的有效方法?

编辑:这是 python 列表和相应的 XML 的样子。注意:数组是 n 维的。

data = [[[1, 2], [3, 4]], [[5, 6], [7, 8]]]

然后是 XML 版本:

<Array>
  <Dimsize>2</Dimsize>
  <Dimsize>2</Dimsize>
  <Dimsize>2</Dimsize>
  <I32>
    <Name />
    <Val>1</Val>
  </I32>

  ... 2, 3, 4, etc.
</Array>

不过,实际格式并不重要,我只是不知道如何从以下位置展开列表:

data = [1, 2, 3, 4, 5, 6, 7, 8]

回到:

data = [[[1, 2], [3, 4]], [[5, 6], [7, 8]]]

给定:

lengths = [2, 2, 2]

假设 pack_simple() 和 unpack_simple() 对基本数据类型(int、long、string、boolean)执行相同的 pack() 和 unpack()。

4

2 回答 2

2

由内而外开始:

def group(seq, k):
    return [seq[i:i+k] for i in range(0, len(seq), k)]

unflattened = group(group(data, 2), 2)

如果您的尺寸不完全相同,您的示例可能会更容易。但我认为上面的代码应该可以工作。

于 2012-06-22T14:48:30.470 回答
2

尝试以下操作:

from operator import mul

def validate(array, sizes):
    if reduce(mul, sizes) != len(array):
        raise ValueError("Array dimension incompatible with desired sizes")

    return array, sizes

def reshape(array, sizes):
    for s in sizes:
        array = [array[i:i + s] for i in range(0, len(array), s)]

    return array[0]

data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
length = [2, 2, 3]

print reshape(validate(data, length))

length = [2, 2, 2]

print reshape(validate(data, length))

输出为:

[[[1, 2], [3, 4]], [[5, 6], [7, 8]], [[9, 10], [11, 12]]]
Traceback:
   (...)
ValueError: Array dimension incompatible with desired sizes

另一种方法是使用numpy数组。请注意,对于这个简单的任务,numpy 是一个相当大的依赖项,尽管您会发现大多数(常见)与数组相关的任务/问题已经在那里实现了:

from numpy import array

print array(data).reshape(*length)  # optionally add .tolist() to convert to list

编辑:添加数据验证

编辑:使用 numpy 数组的示例(感谢 JFSebastian 的提示)

于 2012-06-22T14:55:02.170 回答