在GCC中使用内联汇编从32位IMUL返回64位结果

Question

我试图从以下本质上获得结果...

Inputs EAX, EDX
IMUL EDX
Return EAX:EDX as full 64-bit result

我正在从https://gitorious.org/voxlap/voxlap/source/d467829d05294545ebb4cc088440421b57c7f38f:include/ksnippits.h#L281看这个示例

static inline long mulshr16 (long a, long d)
{
#if defined(__GNUC__) && defined(__i386__) && !defined(NOASM)
__asm__ __volatile__
(
"imul %[d]\n"
"shrd $16, %%edx, %[a]\n"
: [a] "+a" (a)
: [d] "r" (d)
: "edx"
);
return a;
#else // C Default
return (long)(((int64_t)a * (int64_t)d) >> 16);
#endif
}

我只是想保留驻留在EAX：EDX中的完整64位结果，而不是移位的结果，但是我不确定如何使用内联汇编器将其传递回GCC。

Answer 1

试试看，但要仔细测试：

#include <stdio.h>

static inline long long mul64 (long a, long d)
{
  long long rtn;
  __asm__ __volatile__("imull %[d]\n" : 
                       [rtn] "=A" (rtn) : [a] "a" (a), [d] "rm" (d) );
  return rtn;
}

int main(void) 
{
  printf("%lld should be -1524157875019052100.", mul64(-1234567890, 1234567890));
  return 0;
}

就像其他人所说的那样，以下定义产生几乎相同的代码：

static inline long long mul64 (long a, long d)
{
  return (long long)a * d;
}

除了编译器会折叠常量并在可能的情况下使用移位而不是乘法指令之外。 即在许多情况下它将生成更快的代码。

因此，我认为您imull某些原因总是希望发出不imull指令。 这是经历内联汇编之苦的唯一明确原因。

在GCC中使用内联汇编从32位IMUL返回64位结果

问题描述

1 个解决方案

解决方案1
1 已采纳 2014-06-13 14:06:13

在GCC中使用内联汇编从32位IMUL返回64位结果

问题描述

1 个解决方案

解决方案1 1 已采纳 2014-06-13 14:06:13

解决方案1
1 已采纳 2014-06-13 14:06:13