簡體 English 中英

了解CUDA中的矩陣乘法

[英]understanding Matrix multiplication in CUDA

原文 2017-10-21 17:13:24 1 1 c++/ matrix/ cuda/ gpu

我正在嘗試學習CUDA。 我開始嘗試的幫助下矩陣乘法此文章基於GPU。 我的主要問題是我不太了解如何在內核中訪問2D數組，因為訪問2D數組與常規方法（matrix [i] [j]）有點不同。 這是我卡住的部分：

for (int i = 0; i < N; i++) {
    tmpSum += A[ROW * N + i] * B[i * N + COL];
}
C[ROW * N + COL] = tmpSum;

我可以理解ROW和COLUMN是如何派生的。

int ROW = blockIdx.y*blockDim.y+threadIdx.y;
int COL = blockIdx.x*blockDim.x+threadIdx.x;

高度贊賞帶有示例的任何解釋。 謝謝！

1 個解決方案

矩陣是連續存儲的，即在連續位置的每一行之后。 您在此處看到的稱為平面地址，即將兩個元素的索引旋轉為與第一個元素的偏移。

Cuda進行矩陣乘法

[英]Cuda to make Matrix Multiplication

CUDA中的3D元素矩陣乘法？

[英]3D Elementwise Matrix Multiplication in CUDA?

使用CUDA進行矩陣乘法，執行時間長

[英]Matrix Multiplication with CUDA, long execution time

CUDA / CUBLAS矩陣向量乘法

[英]CUDA/CUBLAS Matrix-Vector Multiplication

CUDA c ++，簡單矩陣乘法錯誤

[英]CUDA c++, simple matrix multiplication error

CUDA 中的稀疏矩陣向量乘法

[英]Sparse matrix-vector multiplication in CUDA

使用並行約簡的CUDA矩陣乘法

[英]CUDA Matrix Multiplication using Parallel Reduction

CUDA：使用共享和全局矩陣乘法

[英]cuda: matrix multiplication using shared and global

內核代碼中矩陣的CUDA乘法

[英]CUDA multiple multiplication of the matrix in the kernel code

CUDA：如何使用推力進行矩陣乘法？

[英]CUDA: how to do a matrix multiplication using thrust?

暫無

暫無

聲明:本站的技術帖子網頁，遵循CC BY-SA 4.0協議，如果您需要轉載，請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

相關問題 Cuda進行矩陣乘法 CUDA中的3D元素矩陣乘法？使用CUDA進行矩陣乘法，執行時間長 CUDA / CUBLAS矩陣向量乘法 CUDA c ++，簡單矩陣乘法錯誤 CUDA 中的稀疏矩陣向量乘法使用並行約簡的CUDA矩陣乘法 CUDA：使用共享和全局矩陣乘法內核代碼中矩陣的CUDA乘法 CUDA：如何使用推力進行矩陣乘法？

相關標簽

粵ICP備18138465號 © 2020-2024 STACKOOM.COM