繁体   English   中英

是否可以在并行区域中创建共享2D数组的局部局部选择元素副本? (共享,私有,障碍:OPenMP)

[英]Can a thread-local copy of select elements be created of a shared 2D array in a parallel region? (Shared, private, barrier: OPenMP)

我有n x n元素的二维网格。 在一次迭代中,我通过平均一个邻居的值来计算一个元素的值。 那是:

    for(int i=0;i<n;i++)
        for(int j=0;j<n;j++)
            grid[i][j] = (grid[i-1][j] + grid[i][j-1] + grid[i+1][j] + grid[i][j+1])/4.0;

我需要运行上面的嵌套循环iter迭代次数。 我需要的是以下内容:

  1. 我需要线程来计算该平均值,等到所有线程都完成计算并然后一次更新网格。
  2. 具有iter迭代的循环将顺序运行,但每次迭代期间 ,应并行计算每个ijgrid[i][j]的值。

为此,我有以下想法和问题:

  1. 也许可以共享网格,并通过仅将线程中的这4个元素设为私有来放置计算出grid[i][j]所需的网格中选择的4个元素的副本。 (基本上,所有线程都共享网格,但是每个线程中也有4 个特定迭代的元素的本地副本。) 这可能吗?
  2. 实际上是否需要一个barrier才能使所有线程完成然后开始下一个迭代?

我对OpenMP的思维方式还很陌生,而我完全迷失在这个简单的问题中。 如果有人可以帮助解决我的困惑,我将不胜感激。

  1. 在实践中,您想要的线程数比网格点数少得多,因此每个线程将计算一整束点(例如,一行)。 启动OpenMP(或任何其他类型的)线程有一定的开销,并且您的程序将始终受内存限制,而不是受CPU限制。 因此,为每个网格点启动一个线程将使并行化计算的全部目的无效。 因此,不建议您使用第一个想法(尽管我不确定我是否正确理解它;也许这不是您的建议)。

  2. 我建议(其他人在OP注释中也指出),您应该分配两倍的存储网格值所需的内存,并使用两次在两次迭代之间交换的指针:一个指向保存只读的先前迭代值的内存,另一个指向存储只读值的内存。到只写的新迭代值。 请注意,您将只交换指针,而不实际复制内存。 迭代完成后,您可以将最终结果复制到所需的位置。

  3. 是的,您需要在迭代之间同步线程,但是在OpenMP中,这通常可以通过在迭代循环中打开并行区域来隐式完成(在并行区域的末尾有一个隐式屏障):

     for (int iter = 0; iter < niter; ++iter) { #pragma omp parallel { // get range of points for current thread // loop over thread's points and apply the stencil } } 

    或者,使用parallel for构造:

     const int np = n*n; for (int iter = 0; iter < niter; ++iter) { #pragma omp parallel for for (int ip = 0; ip < np; ++ip) { const int i = ip / n; const int j = ip % n; // apply the stencil to [i,j] } } 

    第二个版本将自动在可用线程之间平均分配工作,这很可能是您想要的。 首先,您必须手动进行。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM