C 在 short 和 int 之间转换的规则是什么？

Question

使用 C 在 short 和 int 之间进行转换时我很困惑。 我假设 short 是 16 位，int 是 32 位。 我用下面的代码进行了测试：

unsigned short a = 0xFFFF;
signed short b = 0xFFFF;

unsigned int u16tou32 = a;
unsigned int s16tou32 = b;
signed int u16tos32 = a;
signed int s16tos32 = b;

printf("%u %u %d %d\n", u16tou32, s16tou32, u16tou32, s16tou32);

我得到的是：

u16tou32：65535
s16tou32：4294967295
u16tos32：65535
s16tos32：-1

我感到困惑的是 s16 到 u32 之间的转换，以及 u16 到 s32 之间的转换。 似乎 s16 到 u32 正在进行“符号扩展”，而 u16 到 s32 则没有。 这背后的规则究竟是什么？ 这也是依赖于实现的吗？ 在 C 中进行这种类型的转换是否安全，还是我应该自己使用位操作来避免意外结果？

Answer 1

任何时候将整数类型转换为不同的整数类型时，它都会按照标准规定的确定性弹球机规则，有时还需要执行。

值限定的一般概述：

C99 6.3.1.1-p2

如果 int 可以表示原始类型的所有值（受宽度限制，对于位域），则将该值转换为 int； 否则，它被转换为unsigned int 。 这些被称为整数提升。 整数提升不会改变所有其他类型。

也就是说，让我们看看您的转换。 以下涵盖了signed-short到unsigned int的内容，因为被转换的值落在unsigned int域之外：

C99 6.3.1.3-p2

否则，如果新类型是无符号的，则通过重复加或减一个新类型可以表示的最大值来转换该值，直到该值在新类型的范围内。

这基本上意味着“添加 UINT_MAX+1”。 在你的机器上，UINT_MAX 是 4294967295，因此，这变成

-1 + 4294967295 + 1 = 4294967295

关于您的unsigned short到有signed int转换，常规价值限定促销涵盖了这一点。 具体来说：

C99 6.3.1.3-p1

当一个整数类型的值转换为_Bool以外的其他整数类型时，如果该值可以用新类型表示，则不变。

换句话说，因为你的unsigned short的值落在了signed int的可覆盖域内，所以没有什么特别的事情，只是简单地保存了这个值。

最后，正如上面的一般评论中提到的，你的b声明发生了一些特殊的事情

signed short b = 0xFFFF;

在这种情况下，0xFFFF 是一个有符号整数。 十进制值为 65535。但是，该值不能用有signed short表示，因此发生了另一种转换，您可能不知道：

C99 6.3.1.3-p3

否则，新类型是有符号的，值不能在其中表示； 要么结果是实现定义的，要么引发实现定义的信号。

换句话说，您的实现选择将其存储为(-1) ，但您不能依赖于不同的实现。

Answer 2

这里发生的事情是，参数的右侧首先从 16 位扩展到 32 位，而向左侧类型的转换仅发生在赋值时。 这意味着如果右侧是有符号的，那么当它转换为 32 位时将被符号扩展，同样如果它是无符号的，那么它只会被零填充。

如果你对你的转换很小心，那么应该没有任何问题——但除非你正在做一些超级性能密集型的事情，否则额外的几个按位操作应该不会有任何伤害。

另一方面，如果您在为不同的整数类型假设某些位宽的情况下做任何事情，您应该真正明确并使用stdint.h 中定义的类型。 我最近在将（其他人的）代码从 *nix 移植到 Windows 时遇到了这个问题，因为 Visual C++ 编译器使用的整数大小约定（LLP64）与我使用过的任何其他 x64 或 power-7 编译器不同(LP64)。 简而言之，如果您想要 32 位，最好使用uint32_t类的类型明确表示。

所以当这种转换发生在 C 中时，这将始终成立？ 由 C 标准定义？ – 君

是的，它应该始终保持。 来自 C99 标准的相关引用（带链接）： “整数提升保留值，包括符号。” 处理通常的算术类型转换时： “...对两个操作数执行整数提升。然后将以下规则应用于提升的操作数......”

Answer 3

如问题中所述，假设 16 位short和 32 位int 。

unsigned short a = 0xFFFF;

这会将a初始化为0xFFFF或65535 。 表达式0xFFFF是int类型； 它被隐式转换为unsigned short ，并保留该值。

signed short b = 0xFFFF;

这有点复杂。 同样， 0xFFFF是int类型。 它被隐式转换为有signed short ——但由于该值超出了有signed short的范围，因此转换无法保留该值。

当值无法表示时，将整数转换为有符号整数类型会产生实现定义的值。 原则上， b的值可以是-32768和+32767之间的任何值。 在实践中，它几乎肯定是-1 。 我将假设其余部分的值为-1 。

unsigned int u16tou32 = a;

a值为0xFFFF ，它从unsigned short转换为unsigned int 。 转换保留了价值。

unsigned int s16tou32 = b;

b值为-1 。 它被转换为unsigned int ，它显然不能存储-1的值。 将整数转换为无符号整数类型（与转换为有符号类型不同）由语言定义； 结果以MAX + 1为模减少，其中MAX是无符号类型的最大值。 在这种情况下，存储在s16tou32值为UINT_MAX - 1或0xFFFFFFFF 。

signed int u16tos32 = a;

的值a ， 0xFFFF ，被转换为signed int 。 该值被保留。

signed int s16tos32 = b;

b的值-1被转换为有signed int 。 该值被保留。

所以存储的值是：

a == 0xFFFF (65535)
b == -1     (not guaranteed, but very likely)
u16tou32 == 0xFFFF (65535)
s16tou32 == 0xFFFFFFFF (4294967295)
u16tos32 == 0xFFFF (65535)
s16tos32 == -1

总结整数转换规则：

如果目标类型可以表示值，则保留该值。

否则，如果目标类型是无符号的，则该值以MAX+1为模减少，这等效于丢弃除低 N 位之外的所有位。 另一种描述方法是，值MAX+1被重复添加到该值或从该值中减去，直到您得到一个在范围内的结果（这实际上是 C 标准描述它的方式）。 编译器实际上并不生成代码来执行这种重复的加法或减法； 他们只需要得到正确的结果。

否则，目标类型是有符号的，不能表示值； 转换产生一个实现定义的值。 在几乎所有实现中，结果使用二进制补码表示丢弃除低序 N 位之外的所有位。 （C99 为这种情况添加了一条规则，允许引发实现定义的信号。我不知道有任何编译器会这样做。）

Answer 4

这是数字 65535 的无符号短表示形式：

unsigned short a = 0xFFFF;

这是数字 -1 的有符号简短表示：

signed short b = 0xFFFF;

从 unsigned short 到 unsigned int 的简单提升，因此 u16tou32 是数字 65535 的 unsigned int 表示：

unsigned int u16tou32 = a;

b（-1 的值）被提升为 int。 因此它的十六进制表示将是 0xFFFFFFFF。 然后它被转换为无符号，因此是数字 4294967295 的表示：

unsigned int s16tou32 = b;

从 unsigned short 到 unsigned int 的提升值为 65535。然后是signed int 的情况，这也将是数字 65535 的表示：

signed int u16tos32 = a;

将 signed short 简单提升为 signed int，因此 s16tos32 也是数字 -1 的表示：

signed int s16tos32 = b;

C 在 short 和 int 之间转换的规则是什么？

问题描述

4 个解决方案

解决方案1
7 已采纳 2013-10-09 04:26:35

解决方案2
4 2013-10-09 04:12:01

解决方案3
4 2013-10-09 04:50:05

解决方案4
0 2013-10-09 04:31:58

C 在 short 和 int 之间转换的规则是什么？

问题描述

4 个解决方案

解决方案1 7 已采纳 2013-10-09 04:26:35

解决方案2 4 2013-10-09 04:12:01

解决方案3 4 2013-10-09 04:50:05

解决方案4 0 2013-10-09 04:31:58

解决方案1
7 已采纳 2013-10-09 04:26:35

解决方案2
4 2013-10-09 04:12:01

解决方案3
4 2013-10-09 04:50:05

解决方案4
0 2013-10-09 04:31:58