繁体   English   中英

OMP使用if语句优化嵌套循环

[英]OMP Optimizing nested loop with if statement

我有以下几行代码试图并行运行

void optimized(int data_len, unsigned int * input_array, unsigned int * output_array, unsigned int * filter_list, int filter_len) {

    #pragma omp parallel for
    for (int j = 0; j < filter_len; j++) {
        for (int i = 0; i < data_len; i++) {
            if (input_array[i] == filter_list[j]) {
              output_array[i] = filter_list[j];
            }
        }
    }
}

仅仅使用pragma语句确实确实产生了奇迹,但是我试图进一步减少这段代码的运行时间。 我尝试了很多事情,从数组填充到折叠循环再到创建任务,但到目前为止看来唯一有效的是循环展开。 关于进一步提高此代码的速度,有人对我可能有什么建议吗?

您正在执行纯内存访问。 这受机器内存带宽的限制。 多线程不会对您有太大帮助。 gcc -O2已经为您提供SSE指令优化。 因此直接使用intel指令可能也无济于事。 您可能会尝试一次检查4个int,因为SSE支持128个寄存器(请参见https://gcc.gnu.org/onlinedocs/gcc-4.4.5/gcc/X86-Built_002din-Functions.html和google的示例)如果可以的话,通过使用short而不是int来减少数据量也有帮助。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM