2

我每天都在使用 Ruby,但我在 Python 中遇到了问题。我发现这种语言非常相似......但是我从 Ruby 迁移时遇到了一些问题 :)

请帮我在python中转换这个动作:

   string = "qwerty2012"
   (var, some_var, another_var)  = string.unpack("a1a4a*")

这应该从字符串返回三个具有解压值的变量:

   var         = "q"      # a1
   some_var    = "wert"   # a4
   another_var = "y2012"  # a*

帮我用Python表示它谢谢!

4

5 回答 5

9
s = "qwerty2012"
(a, b, c) = s[:1], s[1:5], s[5:]
于 2012-06-18T23:25:46.663 回答
5

Python 确实有一个名为struct的类似模块。它缺乏获取字符串其余部分的能力,就像Ruby 和 PHP 从 Perl中提取的那样。你几乎可以到达那里:

>>> import struct
>>> s = 'qwerty2012'
>>> struct.unpack_from('1s4s', s)
('q', 'wert')
>>> def my_unpack(format, packed_string):
...    result = []
...    result.extend(struct.unpack_from(format, packed_string))
...    chars_gobbled = struct.calcsize(format)
...    rest = packed_string[chars_gobbled:]
...    if rest:
...        result.append(rest)
...    return result
...
>>> my_unpack('1s4s', 'qwerty2012')
['q', 'wert', 'y2012']
>>> my_unpack('1s4s', 'qwert')
['q', 'wert']
>>> [hex(x) for x in my_unpack('<I', '\xDE\xAD\xBE\xEF')]
['0xefbeadde']

我希望该struct模块实现了 Perl 的其余部分,unpack因为pack它们对于撕开二进制数据包是非常有用的功能,但唉。

于 2012-06-19T00:13:29.340 回答
4
s = "qwerty2012"
var, some_var, another_var = s[:1], s[1:5], s[5:]

将分别进行分配和产量:

q
wert
y2012

上面的赋值使用了Python Docs中描述的切片符号。这篇 SO post Good Primer for Python Slice Notation也给出了很好的解释。

于 2012-06-18T23:26:14.773 回答
2

这是一个初步的娱乐unpack

import re
import StringIO

def unpack(s, fmt):
    fs = StringIO.StringIO(s)
    res = []
    for do,num in unpack.pattern.findall(fmt):
        if num == '*':
            num = len(s)
        elif num == '':
            num = 1
        else:
            num = int(num)
        this = unpack.types[do](num, fs)
        if this is not None:
            res.append(this)
    return res

unpack.types = {
    '@': lambda n,s: s.seek(n),             # skip to offset
    'a': lambda n,s: s.read(n),             # string
    'A': lambda n,s: s.read(n).rstrip(),    # string, right-trimmed
    'b': lambda n,s: bin(reduce(lambda x,y:256*x+ord(y), s.read(n), 0))[2:].zfill(8*n)[::-1],   # binary, LSB first
    'B': lambda n,s: bin(reduce(lambda x,y:256*x+ord(y), s.read(n), 0))[2:].zfill(8*n)          # binary, MSB first
}
unpack.pattern = re.compile(r'([a-zA-Z@](?:_|!|<|>|!<|!>|0|))(\d+|\*|)')

它适用于您给定的示例,

unpack("qwerty2012", "a1a4a*")  # -> ['q', 'wert', 'y2012']

但有一长串尚未实现的数据类型(请参阅文档)。

于 2012-06-19T01:22:07.080 回答
1

这可能会简化您从 Ruby 的迁移:

import re
import struct

def unpack(format, a_string):
    pattern = r'''a(\*|\d+)\s*'''
    widths = [int(w) if w is not '*' else 0 for w in re.findall(pattern, format)]
    if not widths[-1]: widths[-1] = len(a_string) - sum(widths)
    fmt = ''.join('%ds' % f for f in widths)
    return struct.unpack_from(fmt, a_string)

(var, some_var, another_var) = unpack('a1a4a*', 'qwerty2012')  # also 'a1 a4 a*' OK
print (var, some_var, another_var)

输出:

('q', 'wert', 'y2012')
于 2012-06-19T04:50:23.607 回答