经过艰苦的学习,我尝试在 x86 机器上将 a 左移到 32 位long long
以上。我隐约记得在某处读过比 32 位机器移位运算符仅在前 32 位上工作但无法回忆来源。我想知道在 x86 机器上移动超过 32 位的 uint64_t 整数是否是未定义行为?uint64_t
0
5 回答
标准说(n1570 中的 6.5.7):
3 对每个操作数执行整数提升。结果的类型是提升的左操作数的类型。如果右操作数的值为负数或大于或等于提升的左操作数的宽度,则行为未定义。
4 E1 << E2的结果是E1左移E2位;空出的位用零填充。如果 E1 具有无符号类型,则结果的值为 E1 × 2 E2,比结果类型中可表示的最大值多模一减少。如果 E1 有带符号类型和非负值,并且 E1 × 2 E2在结果类型中是可表示的,那么这就是结果值;否则,行为是未定义的。
5 E1 >> E2 的结果是 E1 右移 E2 位位置。如果 E1 具有无符号类型或 E1 具有有符号类型和非负值,则结果的值是 E1 / 2 E2的商的整数部分。如果 E1 具有带符号类型和负值,则结果值是实现定义的。
移位uint64_t
小于 64 位的距离完全由标准定义。
由于long long
必须至少为 64 位long long
,如果结果不溢出,则移位小于 64 位的值由非负值标准定义。
但是请注意,如果您编写适合 32 位的文字,例如uint64_t s = 1 << 32
@drhirsch 推测的那样,您实际上并没有移动 64 位值,而是 32 位值。那是未定义的行为。
最常见的结果是移位shift_distance % 32
或 0,具体取决于硬件的功能(假设编译器的编译时评估模拟硬件语义,而不是鼻恶魔。)
用于在移位1ULL < 63
unsigned long long
之前生成移位操作数。
C 标准需要转换才能正常工作。特定的错误编译器可能具有您描述的缺陷,但这是错误的行为。
这是一个测试程序:
#include <stdio.h>
#include <inttypes.h>
int main(void)
{
uint64_t x = 1;
for (int i = 0; i < 64; i++)
printf("%2d: 0x%.16" PRIX64 "\n", i, (x << i));
return 0;
}
这是运行 RHEL 5 和 GCC 4.1.2 的 i686 机器、x86/64 机器(也运行 RHEL 5 和 GCC 4.1.2)和 x86/64 Mac(运行 Mac OS X 10.7. 3 与 GCC 4.7.0)。由于这是预期的结果,我的结论是在 32 位机器上没有必要的问题,并且 GCC 至少从 GCC 4.1.2 以来没有出现任何此类错误(并且可能从未出现过这样的错误)。
0: 0x0000000000000001
1: 0x0000000000000002
2: 0x0000000000000004
3: 0x0000000000000008
4: 0x0000000000000010
5: 0x0000000000000020
6: 0x0000000000000040
7: 0x0000000000000080
8: 0x0000000000000100
9: 0x0000000000000200
10: 0x0000000000000400
11: 0x0000000000000800
12: 0x0000000000001000
13: 0x0000000000002000
14: 0x0000000000004000
15: 0x0000000000008000
16: 0x0000000000010000
17: 0x0000000000020000
18: 0x0000000000040000
19: 0x0000000000080000
20: 0x0000000000100000
21: 0x0000000000200000
22: 0x0000000000400000
23: 0x0000000000800000
24: 0x0000000001000000
25: 0x0000000002000000
26: 0x0000000004000000
27: 0x0000000008000000
28: 0x0000000010000000
29: 0x0000000020000000
30: 0x0000000040000000
31: 0x0000000080000000
32: 0x0000000100000000
33: 0x0000000200000000
34: 0x0000000400000000
35: 0x0000000800000000
36: 0x0000001000000000
37: 0x0000002000000000
38: 0x0000004000000000
39: 0x0000008000000000
40: 0x0000010000000000
41: 0x0000020000000000
42: 0x0000040000000000
43: 0x0000080000000000
44: 0x0000100000000000
45: 0x0000200000000000
46: 0x0000400000000000
47: 0x0000800000000000
48: 0x0001000000000000
49: 0x0002000000000000
50: 0x0004000000000000
51: 0x0008000000000000
52: 0x0010000000000000
53: 0x0020000000000000
54: 0x0040000000000000
55: 0x0080000000000000
56: 0x0100000000000000
57: 0x0200000000000000
58: 0x0400000000000000
59: 0x0800000000000000
60: 0x1000000000000000
61: 0x2000000000000000
62: 0x4000000000000000
63: 0x8000000000000000
Daniel Fischer 的回答回答了有关 C 语言规范的问题。关于在 x86 机器上发出可变数量的班次时实际发生的情况,请参阅英特尔软件开发人员手册第 2B 卷,第 25 页。4-506:
计数被屏蔽为 5 位(如果在 64 位模式下使用 REX.W,则为 6 位)。计数范围限制为 0 到 31(如果使用 64 位模式和 REX.W,则为 63)。
因此,如果您尝试移动大于 31 或 63 的量(分别针对 32 位和 64 位值),硬件将仅使用移位量的底部 5 或 6 位。所以这段代码:
uint32_t RightShift(uint32_t value, uint32_t count)
{
return value >> count;
}
将导致在RightShift(2, 33) == 1
x86 和 x86-64 上。根据 C 标准,它仍然是未定义的行为,但在 x86 上,如果编译器将其编译为sar
指令,它将在该架构上定义行为。但是您仍然应该避免编写这种依赖于特定架构怪癖的代码。
移动一个介于 0 和类型宽度的前一个之间的数字不会导致未定义的行为,但左移一个负数会。你会这样做吗?
另一方面,负数右移是实现定义的,并且大多数编译器在右移有符号类型时会传播符号位。
不,没关系。
ISO 9899:2011 6.5.7 移位运算符
如果右操作数的值为负数或大于或等于提升的左操作数的宽度,则行为未定义。
这里不是这种情况,所以一切都很好并且定义明确。