2

假设如下:

bitstring = numpy.random.random_integers(0,2**32,size=8).astype(numpy.uint32)

如何找出 256 位中的哪一个设置为 1?我有这个……但这太疯狂了,不是吗?

maximum = (2**32)-1
for checkbit in range (256):
    yes = bool(numpy.bitwise_and((2**checkbit)%maximum, bitstring[  (  (checkbit // maximum) + checkbit % maximum ) // 32  ] ) )
    print 'bit', checkbit, 'set to', yes, 'in string', (  (checkbit // maximum) + checkbit % maximum ) // 32

我相信答案可能非常简单,但谷歌根本没有帮助,这个相关问题仅指 bytes

由于我需要数十亿次执行此操作,我想知道是否有一种 Pythonic 方法可以使其尽可能快地工作。

4

3 回答 3

3

您可以使用[np.unpackbits] 1,尽管您首先必须将数组视为np.uint8,并注意弄清楚系统的字节序如何影响您获得的结果:

>>> np.unpackbits(bitstring.view(np.uint8))
array([1, 0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1,
       1, 0, 0, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 1, 0, 1, 1, 0,
       0, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 1,
       1, 0, 0, 1, 0, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 0, 0, 1, 0,
       1, 1, 1, 1, 0, 1, 0, 0, 1, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 0, 1,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1,
       1, 0, 1, 0, 0, 0, 1, 1, 0, 0, 1, 1, 0, 1, 0, 0, 1, 0, 1, 1, 0, 0, 0,
       1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 0, 1, 0, 1, 0, 0, 1, 1, 0, 1, 1,
       0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 1, 1, 0, 0, 0, 1, 1, 0, 1,
       1, 0, 0, 1, 1, 0, 1, 0, 0, 0, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 0, 1, 0,
       0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 1, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0,
       0, 0, 0], dtype=uint8)
于 2015-02-06T14:17:38.880 回答
3

我不确定您是要计算“1”位的数量还是要检查是否设置了特定位。

要检查,我想更简单的方法是:bool(n&(1<<b))n被测试的数字在哪里,b是位(从 0 开始)。

要计算“1”位的数量,我想没有什么比查找表更快的了。例如,您可以使用 65k 的内存并将 256 位分成 16 组,每组 16 位。然后,您在表格中查找计数器的值。

为了生成表,您可以使用任何其他提到的方法。例如:

table = [bin(i).count('1') for i in xrange(1<<16)]

然后,要计算位数,您可以将表格中的值相加,例如:

n = 0x123456789123456789
cnt = 0
while n > 0:
    cnt += table[n%((1<<16)-1)]
    n >>= 16

如果你有足够的内存,你可以增加你的表。对于 32 位表,您将需要 4GB 内存。这是处理与内存消耗的经典权衡。

于 2015-02-06T16:07:20.297 回答
1

您可以将python中的数字转换为二进制字符串bin

n = 4187390046
binary_str = bin(n)

哪个产量

Out[7]: '0b11111001100101101000000001011110'

然后您可以在该字符串中找到 1 的所有索引,例如

def find_ones(s):
    return [i - 2 for i, bit in enumerate(s) if bit == '1']

因为二进制字符串有前导0b,你应该相应地调整值

于 2015-02-06T12:45:35.653 回答