[英]Why is -(-2147483648) = - 2147483648 in a 32-bit machine?
我认为问题是自我解释的,我想它可能与溢出有关,但我仍然不太明白。 引擎盖下发生了什么?
为什么-(-2147483648) = -2147483648
(至少在用C编译时)?
表达式-(-2147483648)
在C中完美定义,但是为什么它是这样的可能并不明显。
当你写-2147483648
,它形成为应用于整数常量的一元减运算符。 如果2147483648
不能表示为int
,则它表示为long
或long long
* (以先到者为准),后者的类型由C Standard保证覆盖该值† 。
要确认这一点,您可以通过以下方式检查:
printf("%zu\n", sizeof(-2147483648));
在我的机器上产生8
。
下一个步骤是应用第二-
操作者,在这种情况下的最终值是2147483648L
(假设它最终表示为long
)。 如果您尝试将其分配给int
对象,如下所示:
int n = -(-2147483648);
然后实际行为是实现定义的 。 参考标准:
C11§6.3.1.3/ 3有符号和无符号整数
否则,新类型将被签名,并且值无法在其中表示; 结果是实现定义的,或者引发实现定义的信号。
最常见的方法是简单地切断较高位。 例如,GCC将其记录为:
为了转换为宽度N的类型,该值以2 ^ N的模数减少到该类型的范围内; 没有信号被提出。
从概念上讲,转换为宽度类型32可以通过按位AND运算来说明:
value & (2^32 - 1) // preserve 32 least significant bits
根据二进制补码算法, n
的值由全零和MSB(符号)位组构成,其表示值-2^31
,即-2147483648
。
int
对象: 如果你试图否定int
对象,它保持值为-2147483648
,然后假设两个补码机器,程序将显示未定义的行为 :
n = -n; // UB if n == INT_MIN and INT_MAX == 2147483647
C11§6.5/ 5表达式
如果在计算表达式期间发生异常情况 (即,如果结果未在数学上定义或未在其类型的可表示值范围内),则行为未定义。
*)在退出的C90标准中,没有long long
类型,规则也不同。 具体来说,未加十进制的十进制序列是int
, long int
, unsigned long int
(C90§6.1.3.2整数常量)。
†)这是由于LLONG_MAX
,必须至少为+9223372036854775807
(C11§5.2.4.2.1/ 1)。
注意:此答案不适用于许多编译器仍在使用的过时的ISO C90标准
首先,在C99,C11上,表达式-(-2147483648) == -2147483648
实际上是假的 :
int is_it_true = (-(-2147483648) == -2147483648);
printf("%d\n", is_it_true);
版画
0
那么这个评估结果如何可能呢? 该机器使用32位二进制补码整数。 2147483648
是一个整数常量,完全不适合32位,因此它将是long int
或long long int
具体取决于它所适合的第一个。 否定将导致-2147483648
- 再次,即使数字-2147483648
可以适合32位整数,表达式-2147483648
由一个> 32位正整数组成,前面带有一元-
!
您可以尝试以下程序:
#include <stdio.h>
int main() {
printf("%zu\n", sizeof(2147483647));
printf("%zu\n", sizeof(2147483648));
printf("%zu\n", sizeof(-2147483648));
}
这种机器上的输出最可能是4,8和8。
现在, -2147483648
否定将再次导致+214783648
,它仍然是long int
或long long int
,一切都很好。
在C99,C11中,整数常量表达式-(-2147483648)
在所有符合的实现上都是明确定义的。
现在,当此值分配给int
类型的变量时,具有32位和2的补码表示,该值在其中无法表示 - 32位2的补码上的值范围为-2147483648到2147483647。
C11标准6.3.1.3p3表示以下整数转换:
- [何时]签署新类型并且无法在其中表示值; 结果是实现定义的,或者引发实现定义的信号。
也就是说,C标准实际上并没有定义这种情况下的值是什么,或者不排除由于信号被引发而导致程序执行停止的可能性,而是将其留给实现(即编译器) )决定如何处理它(C11 3.4.1) :
实现定义的行为
未指定的行为,其中每个实现都记录了如何进行选择
和(3.19.1) :
实现定义的值
未指定的值,其中每个实现记录了如何进行选择
在您的情况下,实现定义的行为是该值是32个最低位[*]。 由于2的补码,(长)长int值0x80000000
的位设置为31,所有其他位清零。 在32位二进制补码整数中,位31是符号位 - 意味着该数字为负; 所有值位为零表示该值是最小可表示数,即INT_MIN
。
[*] GCC 在这种情况下记录了其实现定义的行为,如下所示 :
当该值无法在该类型的对象中表示时,将整数转换为有符号整数类型的结果或信号(C90 6.2.1.2,C99和C11 6.3.1.3)。
为了转换为宽度
N
的类型,该值以2^N
模数减少到该类型的范围内; 没有信号被提出。
这不是C问题,因为对于具有int
类型的32位二进制补码表示的C实现,将一元否定运算符应用于具有值-2147483648
的int
的效果是未定义的 。 也就是说,C语言特别拒绝指定评估这种操作的结果。
考虑更一般地,然而,一元如何-
操作者在二的补码算术定义:正数x的反通过翻转其二进制表示的所有位并添加形成1
。 该相同定义也适用于除了其符号位集之外至少有一位的任何负数。
但是,对于没有设置值位的两个数字,出现了一些小问题:0,根本没有设置位,以及只设置其符号位的数字(以32位表示形式的-2147483648)。 当您翻转其中任何一个的所有位时,最终会设置所有值位。 因此,当您随后添加1时,结果会溢出值位。 如果您想象执行添加就像数字是无符号的那样,将符号位视为值位,那么您就得到了
-2147483648 (decimal representation)
--> 0x80000000 (convert to hex)
--> 0x7fffffff (flip bits)
--> 0x80000000 (add one)
--> -2147483648 (convert to decimal)
类似地适用于反转零,但在这种情况下,添加1时的溢出也会溢出以前的符号位。 如果忽略溢出,则得到的32个低位全部为零,因此-0 == 0。
我将使用一个4位数字,只是为了简化数学,但这个想法是一样的。
在4位数字中,可能的值在0000和1111之间。这将是0到15,但如果您想表示负数,则第一位用于表示符号(0表示正数,1表示负数)。
所以1111不是15.因为第一位是1,所以它是负数。 要知道它的值,我们使用前面回答中已经描述的二补码方法:“反转位并加1”:
二进制的0001是十进制的1,所以1111是-1。
双补码方法是双向的,因此如果您将它与任何数字一起使用,它将为您提供具有反转符号的该数字的二进制表示。
现在让我们看看1000.第一位是1,所以这是一个负数。 使用二补法:
所以1000是-8。 如果我们这样做-(-8)
,二进制就意味着-(1000)
,这实际上意味着在1000中使用双补码方法。如上所述,结果也是1000.所以,在一个4位数字中, -(-8)
等于-8。
在32位数字中,二进制的-2147483648
是1000..(31 zeroes)
,但如果使用二补码方法,则最终会得到相同的值(结果是相同的数字)。
这就是为什么在32位数字-(-2147483648)
等于-2147483648
它取决于C的版本,实现的细节以及我们是否在谈论变量或文字值。
要理解的第一件事是C中没有负整数文字“-2147483648”是一元减法操作后跟一个正整数文字。
让我们假设我们运行在一个典型的32位平台上,其中int和long都是32位,long long是64位并考虑表达式。
( - ( - 2147483648)== -2147483648)
编译器需要找到一个可以容纳2147483648的类型,在一个符合C99编译器的编译器中,它将使用“long long”类型,但C90编译器可以使用“unsigned long”类型。
如果编译器使用long long类型,则没有任何溢出,并且比较为false。 如果编译器使用unsigned long,则无符号环绕规则将起作用,并且比较结果为真。
出于同样的原因,将磁带卡座计数器从000向前卷绕500步(通过001 002 003 ...)将显示500,并且从000向后向后绕500步(通过999 998 997 ...)也将显示500 。
这是两个补码表示法。 当然,由于2的补码符号约定是考虑符号位的最高位,结果溢出可表示的范围,就像2000000000 + 2000000000溢出可表示的范围。
结果,处理器的“溢出”位将被置位(看到这需要访问机器的算术标志,通常情况下汇编器之外的大多数编程语言都不是这种情况)。 这是唯一一个在取消2的补码数时设置“溢出”位的值:任何其他值的否定位于由2的补码表示的范围内。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.