c++ - 如何安全地将 uint32_t 中的有符号字段提取为有符号数（int 或 uint32_t）

Question

我有一个项目，在其中我得到一个 32 位 ARM 指令的向量，并且需要将部分指令（偏移值）读取为有符号（二进制补码）数字而不是无符号数字。

我使用了uint32_t向量，因为所有操作码和寄存器都被读取为无符号并且整个指令是 32 位的。

例如：

我有这个 32 位 ARM 指令编码：

uint32_t addr = 0b00110001010111111111111111110110

最后 19 位是我需要读取为有符号整数分支位移的分支的偏移量。 本部分：1111111111111110110

我有这个函数，其中参数是整个 32 位指令：我向左移动 13 位，然后再次向右移动 13 位，以仅具有偏移值并移动指令的另一部分。

我已经尝试将此函数转换为不同的签名变量，使用不同的转换方式和使用其他 c++ 函数，但它会打印未签名的数字。

int getCat1BrOff(uint32_t inst)
{
    uint32_t temp = inst << 13;
    uint32_t brOff = temp >> 13;
    return (int)brOff;
}

我得到十进制数524278 而不是 -10。

我认为最后一个选项不是最好的，但它可能有效的是在字符串中设置所有二进制值。反转位并加 1 以转换它们，然后将新的二进制数转换回十进制。正如我在论文中所做的那样，但这不是一个好的解决方案。

score 2 · Accepted Answer

它归结为进行符号扩展，其中符号位是第 19 个。有两种方法。

使用算术移位。
检测符号位和或与高位。

1. 在 C++ 中没有可移植的方法。但可以检查编译时间。如果下面的代码是 UB，请纠正我，但我相信它只是定义的实现 - 我们在编译时检查它。唯一值得怀疑的事情是将无符号转换为有符号溢出，以及右移，但这应该是实现定义的。

int getCat1BrOff(uint32_t inst)
{
    if constexpr (int32_t(0xFFFFFFFFu) >> 1 == int32_t(0xFFFFFFFFu))
    {
        return int32_t(inst << uint32_t{13}) >> int32_t{13};
    }
    else
    {
        int32_t offset = inst & 0x0007FFFF;
        if (offset & 0x00040000)
        {
            offset |= 0xFFF80000;
        }
        return offset;
    }
}

或更通用的解决方案

template <uint32_t N>
int32_t signExtend(uint32_t value)
{
    static_assert(N > 0 && N <= 32);
    constexpr uint32_t unusedBits = (uint32_t(32) - N);
    if constexpr (int32_t(0xFFFFFFFFu) >> 1 == int32_t(0xFFFFFFFFu))
    {
        return int32_t(value << unusedBits) >> int32_t(unusedBits);
    }
    else
    {
        constexpr uint32_t mask = uint32_t(0xFFFFFFFFu) >> unusedBits;
        value &= mask;
        if (value & (uint32_t(1) << (N-1)))
        {
            value |= ~mask;
        }
        return int32_t(value);
    }
}

https://godbolt.org/z/rb-rRB

score 1 · Accepted Answer

在实践中，您只需要声明temp为已签名：

int getCat1BrOff(uint32_t inst)
{
    int32_t temp = inst << 13;
    return temp >> 13;
}

不幸的是，这不是便携式的：

对于负 a，a >> b 的值是实现定义的（在大多数实现中，这会执行算术右移，因此结果仍然为负）。

但是我还没有遇到一个在这里不做明显事情的编译器。

c++ - 如何安全地将 uint32_t 中的有符号字段提取为有符号数（int 或 uint32_t）

2 回答 2

Related

Reference