为什么在32位机器中 - （ - 2147483648）= - 2147483648？

Question

我认为问题是自我解释的，我想它可能与溢出有关，但我仍然不太明白。 引擎盖下发生了什么？

为什么-(-2147483648) = -2147483648 （至少在用C编译时）？

Answer 1

否定（未固定的）整数常量：

表达式-(-2147483648)在C中完美定义，但是为什么它是这样的可能并不明显。

当你写-2147483648 ，它形成为应用于整数常量的一元减运算符。 如果2147483648不能表示为int ，则它表示为long或long long ^* （以先到者为准），后者的类型由C Standard保证覆盖该值^† 。

要确认这一点，您可以通过以下方式检查：

printf("%zu\n", sizeof(-2147483648));

在我的机器上产生8 。

下一个步骤是应用第二-操作者，在这种情况下的最终值是2147483648L （假设它最终表示为long ）。 如果您尝试将其分配给int对象，如下所示：

int n = -(-2147483648);

然后实际行为是实现定义的 。 参考标准：

C11§6.3.1.3/ 3有符号和无符号整数

否则，新类型将被签名，并且值无法在其中表示; 结果是实现定义的，或者引发实现定义的信号。

最常见的方法是简单地切断较高位。 例如，GCC将其记录为：

为了转换为宽度N的类型，该值以2 ^ N的模数减少到该类型的范围内; 没有信号被提出。

从概念上讲，转换为宽度类型32可以通过按位AND运算来说明：

value & (2^32 - 1) // preserve 32 least significant bits

根据二进制补码算法， n的值由全零和MSB（符号）位组构成，其表示值-2^31 ，即-2147483648 。

否定`int`对象：

如果你试图否定int对象，它保持值为-2147483648 ，然后假设两个补码机器，程序将显示未定义的行为 ：

n = -n; // UB if n == INT_MIN and INT_MAX == 2147483647

C11§6.5/ 5表达式

如果在计算表达式期间发生异常情况 （即，如果结果未在数学上定义或未在其类型的可表示值范围内），则行为未定义。

其他参考：

INT32-C。 确保对有符号整数的操作不会导致溢出

^{*）在退出的C90标准中，没有long long类型，规则也不同。} ^{具体来说，未加十进制的十进制序列是int ， long int ， unsigned long int （C90§6.1.3.2整数常量）。}

^{†）这是由于LLONG_MAX ，必须至少为+9223372036854775807 （C11§5.2.4.2.1/ 1）。}

Answer 2

注意：此答案不适用于许多编译器仍在使用的过时的ISO C90标准

首先，在C99，C11上，表达式-(-2147483648) == -2147483648实际上是假的：

int is_it_true = (-(-2147483648) == -2147483648);
printf("%d\n", is_it_true);

版画

那么这个评估结果如何可能呢？ 该机器使用32位二进制补码整数。 2147483648是一个整数常量，完全不适合32位，因此它将是long int或long long int具体取决于它所适合的第一个。 否定将导致-2147483648 - 再次，即使数字-2147483648可以适合32位整数，表达式-2147483648由一个> 32位正整数组成，前面带有一元- ！

您可以尝试以下程序：

#include <stdio.h>

int main() {
    printf("%zu\n", sizeof(2147483647));
    printf("%zu\n", sizeof(2147483648));
    printf("%zu\n", sizeof(-2147483648));
}

这种机器上的输出最可能是4,8和8。

现在， -2147483648否定将再次导致+214783648 ，它仍然是long int或long long int ，一切都很好。

在C99，C11中，整数常量表达式-(-2147483648)在所有符合的实现上都是明确定义的。

现在，当此值分配给int类型的变量时，具有32位和2的补码表示，该值在其中无法表示 - 32位2的补码上的值范围为-2147483648到2147483647。

C11标准6.3.1.3p3表示以下整数转换：

[何时]签署新类型并且无法在其中表示值; 结果是实现定义的，或者引发实现定义的信号。

也就是说，C标准实际上并没有定义这种情况下的值是什么，或者不排除由于信号被引发而导致程序执行停止的可能性，而是将其留给实现（即编译器））决定如何处理它（C11 3.4.1）：

实现定义的行为

未指定的行为，其中每个实现都记录了如何进行选择

和（3.19.1）：

实现定义的值

未指定的值，其中每个实现记录了如何进行选择

在您的情况下，实现定义的行为是该值是32个最低位[*]。 由于2的补码，（长）长int值0x80000000的位设置为31，所有其他位清零。 在32位二进制补码整数中，位31是符号位 - 意味着该数字为负; 所有值位为零表示该值是最小可表示数，即INT_MIN 。

[*] GCC 在这种情况下记录了其实现定义的行为，如下所示：

当该值无法在该类型的对象中表示时，将整数转换为有符号整数类型的结果或信号（C90 6.2.1.2，C99和C11 6.3.1.3）。

为了转换为宽度N的类型，该值以2^N模数减少到该类型的范围内; 没有信号被提出。

Answer 3

这不是C问题，因为对于具有int类型的32位二进制补码表示的C实现，将一元否定运算符应用于具有值-2147483648的int的效果是未定义的 。 也就是说，C语言特别拒绝指定评估这种操作的结果。

考虑更一般地，然而，一元如何-操作者在二的补码算术定义：正数x的反通过翻转其二进制表示的所有位并添加形成1 。 该相同定义也适用于除了其符号位集之外至少有一位的任何负数。

但是，对于没有设置值位的两个数字，出现了一些小问题：0，根本没有设置位，以及只设置其符号位的数字（以32位表示形式的-2147483648）。 当您翻转其中任何一个的所有位时，最终会设置所有值位。 因此，当您随后添加1时，结果会溢出值位。 如果您想象执行添加就像数字是无符号的那样，将符号位视为值位，那么您就得到了

    -2147483648 (decimal representation)
-->  0x80000000 (convert to hex)
-->  0x7fffffff (flip bits)
-->  0x80000000 (add one)
--> -2147483648 (convert to decimal)

类似地适用于反转零，但在这种情况下，添加1时的溢出也会溢出以前的符号位。 如果忽略溢出，则得到的32个低位全部为零，因此-0 == 0。

Answer 4

我将使用一个4位数字，只是为了简化数学，但这个想法是一样的。

在4位数字中，可能的值在0000和1111之间。这将是0到15，但如果您想表示负数，则第一位用于表示符号（0表示正数，1表示负数）。

所以1111不是15.因为第一位是1，所以它是负数。 要知道它的值，我们使用前面回答中已经描述的二补码方法：“反转位并加1”：

反转位：0000
加1：0001

二进制的0001是十进制的1，所以1111是-1。

双补码方法是双向的，因此如果您将它与任何数字一起使用，它将为您提供具有反转符号的该数字的二进制表示。

现在让我们看看1000.第一位是1，所以这是一个负数。 使用二补法：

反转位：0111
加1：1000（十进制8）

所以1000是-8。 如果我们这样做-(-8) ，二进制就意味着-(1000) ，这实际上意味着在1000中使用双补码方法。如上所述，结果也是1000.所以，在一个4位数字中， -(-8)等于-8。

在32位数字中，二进制的-2147483648是1000..(31 zeroes) ，但如果使用二补码方法，则最终会得到相同的值（结果是相同的数字）。

这就是为什么在32位数字-(-2147483648)等于-2147483648

Answer 5

它取决于C的版本，实现的细节以及我们是否在谈论变量或文字值。

要理解的第一件事是C中没有负整数文字“-2147483648”是一元减法操作后跟一个正整数文字。

让我们假设我们运行在一个典型的32位平台上，其中int和long都是32位，long long是64位并考虑表达式。

（ - （ - 2147483648）== -2147483648）

编译器需要找到一个可以容纳2147483648的类型，在一个符合C99编译器的编译器中，它将使用“long long”类型，但C90编译器可以使用“unsigned long”类型。

如果编译器使用long long类型，则没有任何溢出，并且比较为false。 如果编译器使用unsigned long，则无符号环绕规则将起作用，并且比较结果为真。

Answer 6

出于同样的原因，将磁带卡座计数器从000向前卷绕500步（通过001 002 003 ...）将显示500，并且从000向后向后绕500步（通过999 998 997 ...）也将显示500 。

这是两个补码表示法。 当然，由于2的补码符号约定是考虑符号位的最高位，结果溢出可表示的范围，就像2000000000 + 2000000000溢出可表示的范围。

结果，处理器的“溢出”位将被置位（看到这需要访问机器的算术标志，通常情况下汇编器之外的大多数编程语言都不是这种情况）。 这是唯一一个在取消2的补码数时设置“溢出”位的值：任何其他值的否定位于由2的补码表示的范围内。

为什么在32位机器中 - （ - 2147483648）= - 2147483648？

问题描述

6 个解决方案

解决方案1
74 已采纳 2017-02-25 23:08:41

否定（未固定的）整数常量：

C11§6.3.1.3/ 3有符号和无符号整数

否定`int`对象：

C11§6.5/ 5表达式

其他参考：

解决方案2
16 2017-02-25 23:06:58

解决方案3
6 2017-02-25 22:54:43

解决方案4
1

解决方案5
0 2017-08-30 15:06:14

解决方案6
-1

为什么在32位机器中 - （ - 2147483648）= - 2147483648？

问题描述

6 个解决方案

解决方案1 74 已采纳 2017-02-25 23:08:41

否定（未固定的）整数常量：

C11§6.3.1.3/ 3有符号和无符号整数

否定int对象：

C11§6.5/ 5表达式

其他参考：

解决方案2 16 2017-02-25 23:06:58

解决方案3 6 2017-02-25 22:54:43

解决方案4 1

解决方案5 0 2017-08-30 15:06:14

解决方案6 -1

解决方案1
74 已采纳 2017-02-25 23:08:41

否定`int`对象：

解决方案2
16 2017-02-25 23:06:58

解决方案3
6 2017-02-25 22:54:43

解决方案4
1

解决方案5
0 2017-08-30 15:06:14

解决方案6
-1