是否可以在并行区域中创建共享2D数组的局部局部选择元素副本？（共享，私有，障碍：OPenMP）

Question

我有n x n元素的二维网格。 在一次迭代中，我通过平均一个邻居的值来计算一个元素的值。 那是：

    for(int i=0;i<n;i++)
        for(int j=0;j<n;j++)
            grid[i][j] = (grid[i-1][j] + grid[i][j-1] + grid[i+1][j] + grid[i][j+1])/4.0;

我需要运行上面的嵌套循环iter迭代次数。 我需要的是以下内容：

我需要线程来计算该平均值，等到所有线程都完成计算并然后一次更新网格。
具有iter迭代的循环将顺序运行，但在每次迭代期间，应并行计算每个i和j的grid[i][j]的值。

为此，我有以下想法和问题：

也许可以共享网格，并通过仅将线程中的这4个元素设为私有来放置计算出grid[i][j]所需的网格中选择的4个元素的副本。 （基本上，所有线程都共享网格，但是每个线程中也有4 个特定于迭代的元素的本地副本。） 这可能吗？
实际上是否需要一个barrier才能使所有线程完成然后开始下一个迭代？

我对OpenMP的思维方式还很陌生，而我完全迷失在这个简单的问题中。 如果有人可以帮助解决我的困惑，我将不胜感激。

Answer 1

在实践中，您想要的线程数比网格点数少得多，因此每个线程将计算一整束点（例如，一行）。 启动OpenMP（或任何其他类型的）线程有一定的开销，并且您的程序将始终受内存限制，而不是受CPU限制。 因此，为每个网格点启动一个线程将使并行化计算的全部目的无效。 因此，不建议您使用第一个想法（尽管我不确定我是否正确理解它；也许这不是您的建议）。
我建议（其他人在OP注释中也指出），您应该分配两倍的存储网格值所需的内存，并使用两次在两次迭代之间交换的指针：一个指向保存只读的先前迭代值的内存，另一个指向存储只读值的内存。到只写的新迭代值。 请注意，您将只交换指针，而不实际复制内存。 迭代完成后，您可以将最终结果复制到所需的位置。

是的，您需要在迭代之间同步线程，但是在OpenMP中，这通常可以通过在迭代循环中打开并行区域来隐式完成（在并行区域的末尾有一个隐式屏障）：

 for (int iter = 0; iter < niter; ++iter) { #pragma omp parallel { // get range of points for current thread // loop over thread's points and apply the stencil } }

或者，使用parallel for构造：

 const int np = n*n; for (int iter = 0; iter < niter; ++iter) { #pragma omp parallel for for (int ip = 0; ip < np; ++ip) { const int i = ip / n; const int j = ip % n; // apply the stencil to [i,j] } }

第二个版本将自动在可用线程之间平均分配工作，这很可能是您想要的。 首先，您必须手动进行。

是否可以在并行区域中创建共享2D数组的局部局部选择元素副本？（共享，私有，障碍：OPenMP）

问题描述

1 个解决方案

解决方案1
2 已采纳 2017-08-18 18:09:26

是否可以在并行区域中创建共享2D数组的局部局部选择元素副本？ （共享，私有，障碍：OPenMP）

问题描述

1 个解决方案

解决方案1 2 已采纳 2017-08-18 18:09:26

是否可以在并行区域中创建共享2D数组的局部局部选择元素副本？（共享，私有，障碍：OPenMP）

解决方案1
2 已采纳 2017-08-18 18:09:26