读取CF，PF，ZF，SF，OF

Question

我正在为自己的汇编语言编写虚拟机，我希望能够在执行诸如加法之类的操作时设置进位，奇偶校验，零，符号和溢出标志，因为它们是在x86-64体系结构中设置的。

笔记：

我正在使用Microsoft Visual C ++ 2015和Intel C ++编译器16.0
我正在编译为Win64应用程序。
我的虚拟机（当前）仅对8位整数进行算术运算
我（目前）对其他标志（例如AF）不感兴趣

我当前的解决方案使用以下功能：

void update_flags(uint16_t input)
{
    Registers::flags.carry = (input > UINT8_MAX);
    Registers::flags.zero = (input == 0);
    Registers::flags.sign = (input < 0);
    Registers::flags.overflow = (int16_t(input) > INT8_MAX || int16_t(input) < INT8_MIN);

    // I am assuming that overflow is handled by trunctation
    uint8_t input8 = uint8_t(input);
    // The parity flag
    int ones = 0;
    for (int i = 0; i < 8; ++i)
        if (input8 & (1 << i) != 0) ++ones;

    Registers::flags.parity = (ones % 2 == 0);
}

另外，我将使用以下方法：

uint8_t a, b;
update_flags(uint16_t(a) + uint16_t(b));
uint8_t c = a + b;

编辑：澄清一下，我想知道是否有一种更有效/更好的方法来做到这一点（例如，直接访问RFLAGS）我的代码也可能不适用于其他操作（例如乘法）

编辑2我现在将代码更新为：

void update_flags(uint32_t result)
{
    Registers::flags.carry = (result > UINT8_MAX);
    Registers::flags.zero = (result == 0);
    Registers::flags.sign = (int32_t(result) < 0);
    Registers::flags.overflow = (int32_t(result) > INT8_MAX || int32_t(result) < INT8_MIN);
    Registers::flags.parity = (_mm_popcnt_u32(uint8_t(result)) % 2 == 0);
}

还有一个问题，我的进位标志代码能否正常工作？，我也希望为减法期间发生的“借方”正确设置它。

注意：我正在虚拟化的汇编语言是我自己设计的，意味着很简单，并且基于Intel x86-64（即Intel64）的实现，因此我希望这些标志的行为方式大致相同。

Answer 1

TL：DR ：使用惰性标志评估，请参见下文。

input是一个奇怪的名字。 大多数ISA根据操作结果而不是输入来更新标志。 您正在查看8位操作的16位结果，这是一种有趣的方法。 在C语言中，您应该只使用unsigned int ，它保证至少为uint16_t 。 它将在32位unsigned x86上编译为更好的代码。 16位运算符使用额外的前缀，并且可能导致部分寄存器变慢。

这可能有助于解决您指出的8bx8b-> 16b mul问题，具体取决于您要如何为正在仿真的体系结构中的mul指令定义标志更新。

我认为您的溢出检测不正确。 请参阅x86标签Wiki链接的本教程，了解其操作方法。

这可能不会编译为非常快的代码，尤其是奇偶校验标志。 您是否需要仿真/设计的ISA具有奇偶校验标志？ 您从未说过您正在仿真x86，所以我认为这是您自己设计的某种玩具体系结构。

高效的仿真器（尤其是需要支持奇偶校验标志的仿真器）可能会从某种惰性标志评估中受益匪浅。 保存一个值，您可以根据需要从中计算标志，但是在到达读取标志的指令之前，实际上不进行任何计算。 大多数指令只写标志而不读标志，它们只是将uint16_t结果保存到架构状态。 读标志指令可以从保存的uint16_t仅计算所需的标志，也可以计算所有标志并以某种方式存储。

假设您无法使编译器从结果中实际读取PF ，则可以尝试_mm_popcnt_u32((uint8_t)x) & 1 。 或者，对所有位进行水平异或运算：

x  = (x&0b00001111) ^ (x>>4)
x  = (x&0b00000011) ^ (x>>2)
PF = (x&0b00000001) ^ (x>>1)   // tweaking this to produce better asm is probably possible

我怀疑任何主要的编译器上的结果进可窥视孔-优化一束检查LAHF + SETO al或PUSHF 。 例如，可以导致编译器使用标志条件来检测整数溢出以实现饱和加法。 但是要弄清楚您想要所有标志，并实际上使用LAHF而不是一系列setcc指令，可能是不可能的。 何时可以使用LAHF ，编译器将需要一个模式识别器，并且可能没有人实现，因为用例非常少见。

没有C / C ++方法可以直接访问操作的标志结果，这使C成为实现此类目标的不佳选择。 IDK（如果不是asm，则任何其他语言的确有标记结果）。

我希望您可以通过在asm中编写部分仿真来获得很多性能，但这将是特定于平台的。 更重要的是，还有很多工作要做。

Answer 2

我似乎已经解决了问题，方法是将参数更新参数拆分为一个未签名和已签名的结果，如下所示：

void update_flags(int16_t unsigned_result, int16_t signed_result)
{
    Registers::flags.zero = unsigned_result == 0;
    Registers::flags.sign = signed_result < 0;
    Registers::flags.carry = unsigned_result < 0 || unsigned_result > UINT8_MAX;
    Registers::flags.overflow = signed_result < INT8_MIN || signed_result > INT8_MAX
}

对于加法（对于带符号和无符号的输入都应产生正确的结果），我将执行以下操作：

int8_t a, b;
int16_t signed_result = int16_t(a) + int16_t(b);
int16_t unsigned_result = int16_t(uint8_t(a)) + int16_t(uint8_t(b));
update_flags(unsigned_result, signed_result);
int8_t c = a + b;

对于有符号乘法，我将执行以下操作：

int8_t a, b;
int16_t result = int16_t(a) * int16_t(b);
update_flags(result, result);
int8_t c = a * b;

以此类推，其他更新标志的操作

注意：这里我假设int16_t(a)符号扩展，而int16_t(uint8_t(a))零扩展。

我还决定不使用奇偶校验标志，如果以后改变主意，我的_mm_popcnt_u32解决方案应该可以使用。

PS：感谢所有回答的人，它非常有帮助。 另外，如果任何人都可以在我的代码中发现任何错误，将不胜感激。

读取CF，PF，ZF，SF，OF

问题描述

2 个解决方案

解决方案1
1 2016-03-26 06:32:56

解决方案2
0 已采纳 2016-03-26 12:48:05

读取CF，PF，ZF，SF，OF

问题描述

2 个解决方案

解决方案1 1 2016-03-26 06:32:56

解决方案2 0 已采纳 2016-03-26 12:48:05

解决方案1
1 2016-03-26 06:32:56

解决方案2
0 已采纳 2016-03-26 12:48:05