如何使用openmp優化矩陣向量乘法？

Question

我在 C 中創建了一個執行矩陣向量乘法的程序。 我使用 openMP 指令並行執行計算。 在編譯代碼時，有沒有辦法在沒有優化標志的情況下使用 openMP 進一步優化（= 更少的執行時間）矩陣向量乘法？

代碼：

#include <stdio.h>
#include <math.h>
#include <stdlib.h>
#include <omp.h>
#define SIZE 1000

int main() {
   float A[SIZE][SIZE], b[SIZE], c[SIZE];
   int i, j;
   double tStart, tEnd;

   /* Init */
   for (i=0; i < SIZE; i++)
   {
     for (j=0; j < SIZE; j++)
         /* set A_ij to the minimum of x and y  */
       A[i][j] = fminf(i*1.0/(j+1.0),j*1.0/(i+1.0));
     b[i] = 1.0 * (i+1);
     c[i] = 0.0;
   }

   tStart = omp_get_wtime();

   #pragma omp parallel for private(i,j)
   for (i=0; i < SIZE; i++)
     for (j=0; j < SIZE; j++)
       c[i] = c[i] + A[i][j] * b[j];

   tEnd = omp_get_wtime();
   printf("time taken = %.20f\n", tEnd - tStart);

   return 0;
}

Answer 1

不要這樣做。 找一個好的 BLAS 庫（有很多免費的，谷歌是你的朋友）。

（做到這一點很重要，並且“最好的代碼是您不必編寫的代碼。”）

如何使用openmp優化矩陣向量乘法？

問題描述

1 個解決方案

解決方案1
1 2020-10-24 11:41:53

如何使用openmp優化矩陣向量乘法？

問題描述

1 個解決方案

解決方案1 1 2020-10-24 11:41:53

解決方案1
1 2020-10-24 11:41:53