[英]How to safely extract a signed field from a uint32_t into a signed number (int or uint32_t)
我有一个项目,其中我得到一个 32 位 ARM 指令的向量,并且需要将部分指令(偏移值)读取为有符号(二进制补码)数字而不是无符号数字。
我使用了uint32_t
向量,因为所有操作码和寄存器都被读取为无符号并且整个指令是 32 位的。
例如:
我有这个 32 位 ARM 指令编码:
uint32_t addr = 0b00110001010111111111111111110110
最后 19 位是我需要读取为带符号 integer 分支位移的分支的偏移量。 本部分:1111111111111110110
我有这个 function ,其中参数是整个 32 位指令:我向左移动 13 位,然后再次向右移动 13 位以仅具有偏移值并移动指令的另一部分。
我已经尝试将这个 function 转换为不同的有符号变量,使用不同的转换方式和其他 c++ 函数,但它会打印未签名的数字。
int getCat1BrOff(uint32_t inst)
{
uint32_t temp = inst << 13;
uint32_t brOff = temp >> 13;
return (int)brOff;
}
我得到十进制数524278 而不是 -10 。
我认为最后一个选项不是最好的,但它可能有效的是在字符串中设置所有二进制值。 反转位并加 1 以转换它们,然后将新的二进制数转换回十进制。 正如我在论文中所做的那样,但这不是一个好的解决方案。
它归结为进行符号扩展,其中符号位是第 19 个。 有两种方法。
1. 在 C++ 中没有可移植的方法。 但可以检查编译时间。 如果下面的代码是 UB,请纠正我,但我相信它只是定义的实现 - 我们在编译时检查它。 唯一值得怀疑的事情是将无符号转换为有符号溢出,以及右移,但这应该是实现定义的。
int getCat1BrOff(uint32_t inst)
{
if constexpr (int32_t(0xFFFFFFFFu) >> 1 == int32_t(0xFFFFFFFFu))
{
return int32_t(inst << uint32_t{13}) >> int32_t{13};
}
else
{
int32_t offset = inst & 0x0007FFFF;
if (offset & 0x00040000)
{
offset |= 0xFFF80000;
}
return offset;
}
}
或更通用的解决方案
template <uint32_t N>
int32_t signExtend(uint32_t value)
{
static_assert(N > 0 && N <= 32);
constexpr uint32_t unusedBits = (uint32_t(32) - N);
if constexpr (int32_t(0xFFFFFFFFu) >> 1 == int32_t(0xFFFFFFFFu))
{
return int32_t(value << unusedBits) >> int32_t(unusedBits);
}
else
{
constexpr uint32_t mask = uint32_t(0xFFFFFFFFu) >> unusedBits;
value &= mask;
if (value & (uint32_t(1) << (N-1)))
{
value |= ~mask;
}
return int32_t(value);
}
}
在实践中,您只需将temp
声明为已签名:
int getCat1BrOff(uint32_t inst)
{
int32_t temp = inst << 13;
return temp >> 13;
}
不幸的是,这 不是便携式的:
对于负 a,a >> b 的值是实现定义的(在大多数实现中,这会执行算术右移,因此结果仍然为负)。
但是我还没有遇到一个在这里不做明显事情的编译器。
以下是我的做法:
#include <bitset>
#include <cstddef>
#include <iostream>
int main()
{
uint32_t addr = 0b00110001010111111111111111110110;
uint32_t mask = 0b00000000000011111111111111111111;
int result = ~((addr & mask) ^ mask); // <- here it is
std::cout << std::bitset<32>(addr) << std::endl
<< std::bitset<32>(mask) << std::endl
<< std::bitset<32>(result) << std::endl
<< "result " << result << std::endl;
}
打印:
00110001010111111111111111110110
00000000000011111111111111111111
11111111111111111111111111110110
result -10
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.