如何将 OpenMp 添加到三重嵌套 for 循环

Question

目标是将尽可能多的 OpenMP 添加到以下 Cholesky 因子 function 以增加并行化。 到目前为止，我只有一个#pragma omp parallel for正确实现。 vector<vector<double>>表示一个二维矩阵。 我已经尝试为 for 添加#pragma omp parallel for for
for (int i = 0; i < n; ++i) ， for (int k = 0; k < i; ++k)和for (int j = 0; j < k; ++j)但是并行化出错。 makeMatrix(n, n)初始化大小为nxn的全零vector<vector<double>> 。

vector<vector<double>> cholesky_factor(vector<vector<double>> input)
{
    int n = input.size();
    vector<vector<double>> result = makeMatrix(n, n);
        
    for (int i = 0; i < n; ++i) 
    {
        for (int k = 0; k < i; ++k)
        {
            double value = input[i][k];
            for (int j = 0; j < k; ++j)
            {
                value -= result[i][j] * result[k][j];
            }
            result[i][k] = value / result[k][k];
        }
        double value = input[i][i];
        #pragma omp parallel for
        for (int j = 0; j < i; ++j)
        {
            value -= result[i][j] * result[i][j];
        }
        result[i][i] = std::sqrt(value);
    }

    return result;
}

Answer 1

我不认为你可以用这个算法进行更多的并行化，因为外部循环的第i次迭代取决于i - 1次迭代的结果，而内部循环的第k次迭代取决于结果k - 1次迭代。

vector<vector<double>> cholesky_factor(vector<vector<double>> input)
{
    int n = input.size();
    vector<vector<double>> result = makeMatrix(n, n);
        
    for (int i = 0; i < n; ++i) 
    {
        for (int k = 0; k < i; ++k)
        {
            double value = input[i][k];
            // reduction(-: value) does the same 
            // (private instances of value are initialized to zero and
            // added to the initial instance of value when the threads are joining
            #pragma omp parallel for reduction(+: value)
            for (int j = 0; j < k; ++j)
            {
                value -= result[i][j] * result[k][j];
            }
            result[i][k] = value / result[k][k];
        }
        double value = input[i][i];
        #pragma omp parallel for reduction(+: value)
        for (int j = 0; j < i; ++j)
        {
            value -= result[i][j] * result[i][j];
        }
        result[i][i] = std::sqrt(value);
    }

    return result;
}

如何将 OpenMp 添加到三重嵌套 for 循环

问题描述

1 个解决方案

解决方案1
2 已采纳 2021-03-25 13:55:12

如何将 OpenMp 添加到三重嵌套 for 循环

问题描述

1 个解决方案

解决方案1 2 已采纳 2021-03-25 13:55:12

解决方案1
2 已采纳 2021-03-25 13:55:12