有符号整数和无符号整数有什么区别?
5 回答
您可能知道,int
s 在内部以二进制形式存储。通常 anint
包含 32 位,但在某些环境中可能包含 16 或 64 位(甚至是不同的数字,通常但不一定是 2 的幂)。
但是对于这个例子,让我们看一下 4 位整数。很小,但可用于说明目的。
由于这样一个整数中有四位,它可以假设 16 个值之一;16 是 2 的 4 次方,或 2 次 2 次 2 次 2。这些值是多少?答案取决于这个整数是 asigned int
还是 a unsigned int
。有了unsigned int
,值永远不会是负数;没有与该值关联的符号。以下是四位的 16 个可能值unsigned int
:
bits value
0000 0
0001 1
0010 2
0011 3
0100 4
0101 5
0110 6
0111 7
1000 8
1001 9
1010 10
1011 11
1100 12
1101 13
1110 14
1111 15
... 以下是四位的 16 个可能值signed int
:
bits value
0000 0
0001 1
0010 2
0011 3
0100 4
0101 5
0110 6
0111 7
1000 -8
1001 -7
1010 -6
1011 -5
1100 -4
1101 -3
1110 -2
1111 -1
如您所见,对于signed int
s,最高有效位是1
当且仅当数字为负数时。这就是为什么对于signed int
s,这个位被称为“符号位”。
用外行的话来说,unsigned int 是一个不能为负的整数,因此它可以假设的正值范围更大。带符号的 int 是一个整数,可以为负数,但具有较低的正数范围以换取它可以假设的更多负值。
int
并且unsigned int
是两种不同的整数类型。(int
也可以称为signed int
,或只是signed
;unsigned int
也可以称为unsigned
。)
顾名思义,int
是有符号整数类型,并且unsigned int
是无符号整数类型。这意味着它int
能够表示负值,并且unsigned int
只能表示非负值。
C 语言对这些类型的范围提出了一些要求。的范围int
必须至少是-32767
.. +32767
,而 的范围unsigned int
必须至少是0
.. 65535
。这意味着两种类型都必须至少为 16 位。它们在许多系统上是 32 位,在某些系统上甚至是 64 位。int
由于大多数现代系统使用的二进制补码表示,通常具有额外的负值。
也许最重要的区别是有符号与无符号算术的行为。对于有符号int
,溢出具有未定义的行为。对于unsigned int
,没有溢出;任何产生超出类型范围的值的操作都会环绕,例如UINT_MAX + 1U == 0U
.
任何整数类型,无论是有符号的还是无符号的,都对无限的数学整数集的子范围进行建模。只要您使用类型范围内的值,一切正常。当您接近一个类型的下限或上限时,您会遇到不连续性,并且可能会得到意想不到的结果。对于有符号整数类型,只有非常大的负值和正值才会出现问题,超过INT_MIN
和INT_MAX
。对于无符号整数类型,在非常大的正值和零处会出现问题。这可能是错误的来源。例如,这是一个无限循环:
for (unsigned int i = 10; i >= 0; i --) [
printf("%u\n", i);
}
因为i
总是大于或等于零;这就是无符号类型的本质。(在循环内部,当i
为零时,i--
将其值设置为UINT_MAX
。)
有时我们预先知道存储在给定整数变量中的值将始终为正值——例如,当它仅用于计数时。在这种情况下,我们可以将变量声明为无符号的,如unsigned int num student;
. 通过这样的声明,允许的整数值的范围(对于 32 位编译器)将从 -2147483648 到 +2147483647 的范围转移到 0 到 4294967295 的范围。因此,将整数声明为无符号整数几乎会使可能的最大值的大小翻倍它可以保持的价值。
在实践中,有两个区别:
- 打印(例如,
cout
在 C++ 或printf
C 中):无符号整数位表示被打印函数解释为非负整数。 - ordering:排序取决于有符号或无符号规范。
此代码可以使用排序标准识别整数:
char a = 0;
a--;
if (0 < a)
printf("unsigned");
else
printf("signed");
char
signed
在某些编译器和unsigned
其他编译器中考虑。上面的代码使用排序标准确定在编译器中考虑哪一个。如果a
是无符号的,在 之后a--
,它将大于0
,但如果是signed
,它将小于零。但在这两种情况下, 的位表示a
是相同的。也就是说,在这两种情况下a--
,对位表示的更改都是相同的。