cost 337 ms
ARM SVE:svld1(掩碼,ptr)與 svldff1(svptrue<>,ptr)

[英]ARM SVE: svld1(mask, ptr) vs svldff1(svptrue<>, ptr)

在 ARM SVE 中,有屏蔽加載指令svld1和非失敗加載svldff1(svptrue&lt;&gt;) 。 問題: svld1與svldff1的掩碼相反是否有意義? svldff1中掩碼的行為似乎令人困惑。 是否有實際理由為svldff1提供一個不僅僅是svptrue的掩碼 svld1和 ...

2022-12-17 19:46:12   1   61    arm / simd / sve  
ARM-SVE:包裝運行時大小的寄存器

[英]ARM-SVE: wrapping runtime sized register

在通用 SIMD 庫中,我們正在sve支持長度不可知的sve 但是,我們找不到將sizeless寄存器包裝到結構中來圍繞它進行一些元編程。 有沒有辦法做到這一點? clang 或 gcc。 我發現了一些關於__sizeless_struct的討論和一些補丁,但我認為它在任何地方都沒有 go。 我還 ...

2022-08-02 16:01:00   1   32    gcc / armv8 / sve  
Neoverse V1 中的 int8 矩陣乘法指令是什么?

[英]What are the int8 matrix multiply instructions in Neoverse V1?

這篇 WikiChip 文章指出 Neoverse V1 具有int8指令,每個 CPU 時鍾(大概是每個內核)允許 256 次操作: 我試圖了解這些說明是什么。 他們接受int8輸入並將結果累積到int8或int16中(有溢出風險或需要飽和),還是累積到int32中? 這些指令是什么? ...

AArch64 Neon 和 SVE 的軟件優化指南

[英]Software optimization guide for AArch64 Neon and SVE

有 ARM 軟件優化指南(例如, https ://developer.arm.com/documentation/swog309707/latest for neoverse n1)。 本指南似乎不包含 Neon 或 SVE 的延遲和吞吐量。 是否有針對 NEON 或 SVE 的單獨指南(例如I ...

為什么SVE的最大寄存器長度是2048位?

[英]why the maximum register length of SVE is 2048 bits?

最近在看ARM的SVE,想知道為什么SVE中的最大寄存器長度是2048位,如果大於這個值會有什么問題? ...

2022-04-11 15:29:12   1   137    arm / sve  
AArch64 SVE/2 - 列表中的左包元素

[英]AArch64 SVE/2 - Left pack elements from list

我正在嘗試使用 AArch64 SVE (或SVE2 )實現 SIMD 算法,該算法采用元素列表並僅選擇滿足特定條件的元素。 它通常稱為左包裝 ( SSE/AVX/AVX-512 ),還是 Stream 壓實 ( CUDA )? 是否可以使用 SVE 對該操作進行矢量化? 等效的 SQL 和標量代碼 ...

如何使用 LLVM 生成 SVE 向量

[英]How can I generate SVE vectors with LLVM

clang 版本 11.0.0 示例.c: 命令: LLVM 總是生成 NEON 向量,但我希望它生成 SVE 向量。 我怎樣才能做到這一點? ...

GNU 工具鏈中的 SVE / SVE2 支持

[英]SVE / SVE2 support in GNU toolchain

我想編寫一個 SVE/SVE2 代碼(匯編和/或 C 內在代碼)。 哪個版本的 GNU 支持 SVE / SVE2? 如果支持,我也對自動矢量化感興趣。 ...

2019-07-05 14:33:17   2   155    sve  
ARM SVE從左到右與樹的還原

[英]ARM SVE Left-to-right vs. tree reduction

我目前正在移植一些應用程序,以將ARM SVE功能與SVE的ARM C語言擴展中定義的內在功能一起使用。 檢查文檔后,我遇到了兩個函數,它們使用歸約法對浮點向量的元素求和。 那就是使用從左到右和基於樹的約簡。 文檔: 這些函數(ADDV)將浮點向量的所有活動元素相加。 ...

如何使用GNU GAS或LLVM匯編ARM SVE指令並在QEMU上運行它?

[英]How to assemble ARM SVE instructions with GNU GAS or LLVM and run it on QEMU?

我想使用開源工具來使用新的ARM SVE指令 。 首先,我希望匯編以下最小示例: https : //developer.arm.com/docs/dui0965/latest/getting-started-with-the-sve-compiler/assembling-sve-cod ...

2018-10-19 08:51:27   1   302    arm / sve  
帶可擴展矢量擴展(SVE)的ARM V-8

[英]ARM V-8 with Scalable Vector Extension (SVE)

我遇到這一點,ARMv8現在支持從128 bits to 2048 bits可變長度向量寄存器( scalable vector extension SVE )。 具有更大的寄存器寬度以實現數據級並行性總是好的。 但在什么基礎上我們需要從128位到2048位選擇寄存器的大小以實現最大性能? ...

新的ARM SVE指令有多便攜?

[英]How portable are the new ARM SVE instructions?

我正在尋找有關Arm的新可縮放矢量單元(SVE)的信息。 對於我來說,使用能夠並行計算2048位的圖像處理對我來說看起來非常好。 但我不確定它是否會在每個Armv8上運行,如RPI 3或只是一些超級計算機。 有沒有人知道它將被包含在Linux內核中的時間表。 我從2016年8月的宣布 ...


排序:
質量:
 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM