簡體 English 中英

GCC無法對64位乘法進行矢量化。可以在AVX2上對64位x 64位 - > 128位加寬乘法進行矢量化嗎？

[英]GCC couldn't vectorize 64-bit multiplication. Can 64-bit x 64-bit -> 128-bit widening multiplication be vectorized on AVX2?

原文 2014-07-04 08:14:37 8 1 c++/ computer-science/ vectorization/ simd/ avx2

我嘗試對使用64位加寬乘法的CBRNG進行矢量化。

static __inline__ uint64_t mulhilo64(uint64_t a, uint64_t b, uint64_t* hip) {
    __uint128_t product = ((__uint128_t)a)*((__uint128_t)b);
    *hip = product>>64;
    return (uint64_t)product;
}

這種乘法在AVX2中是否以矢量化形式存在？

1 個解決方案

沒有。作為矢量指令，沒有64 x 64 - > 128位算術。 也沒有矢量mulhi類型指令（乘法的高字結果）。

[V] PMULUDQ只能將每秒32位無符號元素或無符號雙字作為源，並將每個64位結果擴展為兩個結果元素組合為無符號四字，從而可以執行32 x 32 - > 64位。

您現在可能希望的最好的是Haswell的MULX指令，它具有更靈活的寄存器使用，並且不會影響標志寄存器 - 消除了一些停頓。

在64位x 64位乘法中使用Karatsuba算法真的很有效嗎？

[英]Is it really efficient to use Karatsuba algorithm in 64-bit x 64-bit multiplication?

GCC 的 64 位版本未編譯 64 位 exe

[英]64-bit version of GCC not compiling 64-bit exe

x86上的兩個128位整數的高效乘法/除法（無64位）

[英]Efficient Multiply/Divide of two 128-bit Integers on x86 (no 64-bit)

使用 AVX 對 64 位結構進行排序？

[英]Sorting 64-bit structs using AVX?

MinGW作為可靠的64位GCC編譯器

[英]MinGW as a reliable 64-bit GCC compiler

用於64位窗口的64位Boost版本

[英]64-bit version of Boost for 64-bit windows

CMake 64 位和 SFML 64 位

[英]CMake 64-bit with SFML 64-bit

Mac 64位系統調用

[英]Mac 64-bit syscall

指定64位對齊

[英]Specifying 64-bit alignment

使用64位類型？

[英]Use of 64-bit types?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 在64位x 64位乘法中使用Karatsuba算法真的很有效嗎？ GCC 的 64 位版本未編譯 64 位 exe x86上的兩個128位整數的高效乘法/除法（無64位）使用 AVX 對 64 位結構進行排序？ MinGW作為可靠的64位GCC編譯器用於64位窗口的64位Boost版本 CMake 64 位和 SFML 64 位 Mac 64位系統調用指定64位對齊使用64位類型？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM