簡體 English 中英

為什么在 AVX512 中復制 function 置零？

[英]Why duplicated function in AVX512 to set zero?

原文 2022-12-12 18:39:20 1 1 simd/ intrinsics/ avx512

我來到了這兩個功能：

_mm512_setzero_epi32()
_mm512_setzero_si512()

從邏輯上講，他們在做同樣的事情。 然后查看生成的Assembly ，在不同的優化級別下也發現一樣。

這是一個簡單的問題：為什么 AVX512 有這樣的重復設計，將 int 設置為 0？

1 個解決方案

`_mm512_setzero_epi32()`是 100% 冗余的，沒有理由使用

出於編碼風格的原因，我建議不要這樣做。 它不遵循_mm_setzero_si128() / _mm256_setzero_si256()的相同模式返回_mm512_setzero_si512()遵循的全零的 SIMD 整數向量。

這種情況與無用且冗余的_mm512_loadu_epi32非常相似（它會混淆地加載整個 64 字節向量，而不是 4 字節標量）。 並非所有編譯器都支持_mm512_loadu_epi32或_mm512_loadu_epi64 ， _mm512_setzero_epi32也可能是這種情況； 避免使用它以支持更標准和明顯的另一個原因。

對於_mm512_loadu_epi32和_mm512_and_epi32等冗余內在函數，它們是_mm512_maskz_loadu_epi32和_mm512_mask_loadu_epi32等模式的一部分； 屏蔽需要一個元素大小，並且具有至少 forms 的未屏蔽內在模式，如_mm512_add_epi32必須存在相同操作的不同元素大小版本，並且沒有_si512版本。

但是當前版本的內在函數指南中沒有合並屏蔽或零屏蔽setzero內在函數。 因此， setzero_epi32不屬於任何模式。

在 asm 中，沒有vpxor zmm ，只有vpxord和vpxorq ，因為基本上所有 AVX-512 指令都支持屏蔽，這意味着必須有一個元素大小。 （對於像vmovdqa64 / 32這樣的動作也是如此。）

那么_mm512_setzero_epi32()是否意味着使用vpxord ？ 不，英特爾的內在函數指南實際上將其記錄為使用vpxorq ，就像所有其他 512 位歸零內在函數一樣（包括_mm512_setzero_ps() - 有趣的事實； EVEX vxorps需要 AVX512DQ 擴展，KNL Xeon Phi 不支持，僅在主流中支持（Skylake-avx512及更高版本）CPU）。

至於編譯器實際選擇使用什么歸零指令，可以是兩者之一，這沒有區別。

AVX512 - 如何將所有設置位向右移動？

[英]AVX512 - How to move all set bits to the right?

AVX512 中的人口數

[英]Population count in AVX512

AVX512中是否有像_mm512_sign_epi16（__ m512i a，__ m512i b）的功能

[英]Is there an function in AVX512 like _mm512_sign_epi16 (__m512i a, __m512i b)

使用 AVX512 生成蒙版的 BMI

[英]BMI for generating masks with AVX512

未對齊的向量指針異常 (AVX512)

[英]Unaligned vector pointers oddities (AVX512)

如何在 C# 中獲取 AVX512？

[英]How to get AVX512 in C#?

如何在編譯時禁用 glibc 中的 AVX512 和/或 AVX2？

[英]How to disable AVX512 and/or AVX2 in glibc at compile time?

用__m512水平添加（AVX512）

[英]Horizontal add with __m512 (AVX512)

用 AVX512 比較兩個 128 位值

[英]Compare two 128-bit value with AVX512

有什么方法可以將基於AVX512 CPU intrinics的unsigned char轉換為short？

[英]any ways to convert unsigned char to short based on AVX512 cpu intrinics?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 AVX512 - 如何將所有設置位向右移動？ AVX512 中的人口數 AVX512中是否有像_mm512_sign_epi16（__ m512i a，__ m512i b）的功能使用 AVX512 生成蒙版的 BMI 未對齊的向量指針異常 (AVX512) 如何在 C# 中獲取 AVX512？如何在編譯時禁用 glibc 中的 AVX512 和/或 AVX2？用__m512水平添加（AVX512）用 AVX512 比較兩個 128 位值有什么方法可以將基於AVX512 CPU intrinics的unsigned char轉換為short？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM