繁体   English   中英

如何使用OpenCL内核来做累加器?

[英]How can I use OpenCL kernel to make accumulator?

    __kernel void cl_test(__global int* Number)
    {
       int id = get_global_id(0);
       if (id%5==0)
       {
           Number[0]++;
       }
       if (id%10==0)
       {
           Number[1]++;
       }
    }

如您所见,这是一个非常简单的OpenCL内核测试代码,我想要的是收集在一个范围内被5和10整除的数字。

这就是问题所在:由于每个工作项的计算都不是完全并行的,因此不同项中的Number [0]或[1]是相关的。 我无法通过读取Number [0]或Number [1]来获得正确的结果。

有没有像C ++中的“全局变量”这样的解决方案?

谢谢!

您需要使用原子操作。

__kernel void cl_test(__global int* Number)
{
   int id = get_global_id(0);
   if (id%5==0)
   {
       atomic_inc(Number);
   }
   if (id%10==0)
   {
       atomic_inc(&Number[1]);
   }
}

您应该避免尽可能多地使用原子操作,因为原子操作往往会相当慢,因为原子操作会确保原子操作在线程之间正确运行。

原子加法将解决求和问题

 __kernel void cl_test(__global int* Number)
    {
       int id = get_global_id(0);
       if (id%5==0)
       {
           atomic_add( Number, 1 );
       }
       if (id%10==0)
       {
           atomic_add( Number +1, 1 );
       }
    }

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM