2

假设我有一个浮点数。我想提取数字的基数 2 表示中所有个位的位置。

例如,10.25 = 2^-2 + 2^1 + 2^3,所以它的 base-2 个位置是 {-2, 1, 3}。

一旦我有了一个 number 的 base-2 powers 列表n,下面的内容应该总是返回 true (在伪代码中)。

sum = 0
for power in powers:
    sum += 2.0 ** power
return n == sum

但是,在 C 和 C++ 中对浮点数执行位逻辑有些困难,更难移植。

使用少量 CPU 指令的任何一种语言如何实现这一点?

4

2 回答 2

4

放弃可移植性,假设 IEEEfloat和 32-bit int

// Doesn't check for NaN or denormalized.
// Left as an exercise for the reader.
void pbits(float x)
{
    union {
        float f;
        unsigned i;
    } u;
    int sign, mantissa, exponent, i;
    u.f = x;
    sign = u.i >> 31;
    exponent = ((u.i >> 23) & 255) - 127;
    mantissa = (u.i & ((1 << 23) - 1)) | (1 << 23);
    for (i = 0; i < 24; ++i) {
        if (mantissa & (1 << (23 - i)))
            printf("2^%d\n", exponent - i);
    }
}

这将打印出与给定浮点数相加的 2 的幂。例如,

$ ./a.out 156
2^7
2^4
2^3
2^2
$ ./a.out 0.3333333333333333333333333
2^-2
2^-4
2^-6
2^-8
2^-10
2^-12
2^-14
2^-16
2^-18
2^-20
2^-22
2^-24
2^-25

你可以看到 1/3 是如何四舍五入的,这并不直观,因为无论我们使用多少个小数位,我们总是会以十进制向下舍入它。

脚注:请勿执行以下操作:

float x = ...;
unsigned i = *(unsigned *) &x; // no

的技巧union不太可能产生警告或混淆编译器。

于 2012-08-03T21:50:39.357 回答
4

无需处理浮点数的编码。C 提供了以可移植方式处理浮点值的例程。以下作品。

#include <math.h>
#include <stdio.h>
#include <stdlib.h>


int main(int argc, char *argv[])
{
    /*  This should be replaced with proper allocation for the floating-point
        type.
    */
    int powers[53];
    double x = atof(argv[1]);

    if (x <= 0)
    {
        fprintf(stderr, "Error, input must be positive.\n");
        return 1;
    }

    // Find value of highest bit.
    int e;
    double f = frexp(x, &e) - .5;
    powers[0] = --e;
    int p = 1;

    // Find remaining bits.
    for (; 0 != f; --e)
    {
        printf("e = %d, f = %g.\n", e, f);
        if (.5 <= f)
        {
            powers[p++] = e;
            f -= .5;
        }
        f *= 2;
    }

    // Display.
    printf("%.19g =", x);
    for (int i = 0; i < p; ++i)
        printf(" + 2**%d", powers[i]);
    printf(".\n");

    // Test.
    double y = 0;
    for (int i = 0; i < p; ++i)
        y += ldexp(1, powers[i]);

    if (x == y)
        printf("Reconstructed number equals original.\n");
    else
        printf("Reconstructed number is %.19g, but original is %.19g.\n", y, x);

    return 0;
}
于 2012-08-04T01:39:40.963 回答