繁体 English 中英

使用数组元素进行OpenMP并行化

[英]OpenMP parallelization with array elements

原文 2016-12-17 18:54:40 1 2 c++/ openmp/ eigen

我一直在使用OpenMP，并且尝试查看是否可以在特定的C ++代码中获得加速。

    #pragma omp parallel for
    for (Index j=alignedSize; j<size; ++j)
    {
      res[j] = cj.pmadd(lhs0(j), pfirst(ptmp0), res[j]);
      res[j] = cj.pmadd(lhs1(j), pfirst(ptmp1), res[j]);
      res[j] = cj.pmadd(lhs2(j), pfirst(ptmp2), res[j]);
      res[j] = cj.pmadd(lhs3(j), pfirst(ptmp3), res[j]);
    }

我是OpenMP的一个新手，所以请对我好一点，但是有人能说明为什么这段代码最终会使执行时间加倍而不是加快执行时间吗？

我正在使用4核，以防万一。

2 个解决方案

res条目的大小是多少？ 如果它小于缓存行的大小，则可能是错误共享。

典型cpu的最低要求是128个字节的块，然后您需要统一的最后一级缓存。

OpenMP 并行化

[英]OpenMP parallelization

OpenMP嵌套并行化

[英]OpenMP nested parallelization

OpenMP并行化停止工作

[英]OpenMP parallelization stopped working

OpenMP有序并行化

[英]OpenMP Ordered Parallelization

使用openmp并行化中止线程

[英]Abort thread with openmp parallelization

使用OpenMP并行化嵌套循环

[英]Parallelization of nested loops with OpenMP

openMP - 与for循环和私有的并行化

[英]openMP - parallelization with for loop and private

在递归函数上的OpenMP并行化

[英]OpenMP parallelization on a recursive function

使用OpenMP并行化时出现分段错误

[英]Segmentation fault on parallelization with OpenMP

openMP的并行化效率

[英]Parallelization efficiency of openMP

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 OpenMP 并行化 OpenMP嵌套并行化 OpenMP并行化停止工作 OpenMP有序并行化使用openmp并行化中止线程使用OpenMP并行化嵌套循环 openMP - 与for循环和私有的并行化在递归函数上的OpenMP并行化使用OpenMP并行化时出现分段错误 openMP的并行化效率

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM