python - 每 2 个字母解析一次字符串

Question

我如何解析来自.txt文件的长字符串

2 个字符

?

score 2 · Accepted Answer

尝试

print re.findall(r'[\S]{1,2}', "The quick brown fox jumped over the lazy dog")

>>
['Th', 'e', 'qu', 'ic', 'k', 'br', 'ow', 'n', 'fo', 'x', 'ju', 'mp', 'ed', 'ov', 'er', 'th', 'e', 'la', 'zy', 'do', 'g']

或者

print re.findall(r'.{1,2}', "The quick brown fox jumped over the lazy dog")

>>
['Th', 'e ', 'qu', 'ic', 'k ', 'br', 'ow', 'n ', 'fo', 'x ', 'ju', 'mp', 'ed', ' o', 've', 'r ', 'th', 'e ', 'la', 'zy', ' d', 'og']

更新

对于您的具体要求：

>>> print re.findall(r'[\S]{1,2}', "08AB78UF")
['08', 'AB', '78', 'UF']
>>>

score 2 · Accepted Answer

您可以只压缩两个字符串，间隙为一个偏移量

>>> data = "foobar"
>>> map(''.join, zip(data, data[1:]))
['fo', 'oo', 'ob', 'ba', 'ar']

以及使用 itertools.izip 的类似解决方案

>>> from itertools import izip
>>> map(''.join, izip(data, data[1:]))
['fo', 'oo', 'ob', 'ba', 'ar']

如果您使用的是 Py3.X，请将地图转换为 LC

>>> [''.join(e) for e in  izip(data, data[1:])]
['fo', 'oo', 'ob', 'ba', 'ar']

正如@Duncan 提到的，子字符串会重叠。如果您想要不重叠的子字符串，请参考@Duncan 的答案，或@Duncan 的评论或石斑鱼配方

>>> [''.join(e) for e in list(izip_longest(*[iter(data)] * 2,fillvalue=''))]
['fo', 'ob', 'ar']

您可以轻松地将结果列表加入字符串

>>> ' '.join(''.join(e) for e in  izip(data, data[1:]))
'fo oo ob ba ar'

python - 每 2 个字母解析一次字符串

2 回答 2

Related

Reference