4

在 php 中,unpack() 有一个“*”标志,意思是“重复这种格式直到输入结束”。例如,这将打印 97、98、99

$str = "abc";
$b = unpack("c*", $str);
print_r($b);

python中有这样的东西吗?当然,我可以

str = "abc"
print struct.unpack("b" * len(str), str)

但我想知道是否有更好的方法。

4

2 回答 2

5

在 Python 3.4 及更高版本中,您可以使用新函数struct.iter_unpack.

struct.iter_unpack(fmt, buffer)

根据格式字符串 fmt 从缓冲缓冲区中迭代解包。这个函数返回一个迭代器,它将从缓冲区中读取相同大小的块,直到它的所有内容都被消耗完。缓冲区的字节大小必须是格式所需大小的倍数,如 calcsize() 所反映的。

每次迭代都会产生一个由格式字符串指定的元组。

假设我们想b'\x01\x02\x03'*3用重复的格式字符串解包数组'<2sc'(2 个字符后跟一个字符,重复直到完成)。

使用iter_unpack,您可以执行以下操作:

>>> import struct
>>> some_bytes = b'\x01\x02\x03'*3
>>> fmt = '<2sc'
>>> 
>>> tuple(struct.iter_unpack(fmt, some_bytes))
((b'\x01\x02', b'\x03'), (b'\x01\x02', b'\x03'), (b'\x01\x02', b'\x03'))

如果要取消嵌套此结果,可以使用itertools.chain.from_iterable.

>>> from itertools import chain
>>> tuple(chain.from_iterable(struct.iter_unpack(fmt, some_bytes)))
(b'\x01\x02', b'\x03', b'\x01\x02', b'\x03', b'\x01\x02', b'\x03')

当然,您可以只使用嵌套推导来做同样的事情。

>>> tuple(x for subtuple in struct.iter_unpack(fmt, some_bytes) for x in subtuple)
(b'\x01\x02', b'\x03', b'\x01\x02', b'\x03', b'\x01\x02', b'\x03')
于 2018-04-19T17:39:13.117 回答
4

没有内置这样的工具struct.unpack,但可以定义这样的函数:

import struct

def unpack(fmt, astr):
    """
    Return struct.unpack(fmt, astr) with the optional single * in fmt replaced with
    the appropriate number, given the length of astr.
    """
    # http://stackoverflow.com/a/7867892/190597
    try:
        return struct.unpack(fmt, astr)
    except struct.error:
        flen = struct.calcsize(fmt.replace('*', ''))
        alen = len(astr)
        idx = fmt.find('*')
        before_char = fmt[idx-1]
        n = (alen-flen)/struct.calcsize(before_char)+1
        fmt = ''.join((fmt[:idx-1], str(n), before_char, fmt[idx+1:]))
        return struct.unpack(fmt, astr)

print(unpack('b*','abc'))
# (97, 98, 99)
于 2011-10-23T17:37:54.403 回答