繁体 English 中英

为什么我的OpenMP实现比单线程实现慢？

[英]Why is my OpenMP implementation slower than a single threaded implementation?

原文 2011-02-18 14:17:54 5 3 c/ openmp

我正在学习OpenMP并发性，并尝试了我现有的一些代码。 在这段代码中，我尝试将所有for循环并行化。 但是，这似乎使程序更慢，比单线程版本慢10倍甚至更多。

这是代码： http ： //pastebin.com/zyLzuWU2

我也使用了pthreads，结果比单线程版本更快。

现在的问题是，在我的OpenMP实现中我做错了什么导致了这种放缓？

谢谢！

编辑：单线程版本只是没有所有#pragmas的版本

3 个解决方案

我在您的代码中看到的一个问题是，您在非常小的循环（例如，8或64次迭代）中使用OpenMP。 由于开销，这将无效。 如果要将OpenMP用于n-queens问题，请查看OpenMP 3.0任务和线程并行性以解决分支绑定问题。

我认为您的代码太复杂了，无法在此处进行审核。 我立即看到的一个错误是它甚至不正确。 在使用omp parallel for执行求和的地方，必须使用reduction(+: yourcountervariable)将不同线程的结果正确组合在一起。 否则，一个线程可能会覆盖其他线程的结果。

至少有两个原因：

你只做了一个非常简单的循环的8次迭代。 您的运行时将完全由设置所有线程所涉及的开销所主导。
在某些地方， critical部分会引起争议; 所有线程都将尝试连续访问临界区，并相互阻塞。

为什么我的OpenMP实现比单线程实现慢？（跟进）

[英]Why is my OpenMP implementation slower than a single threaded implementation? (Followup)

Quicksort - 为什么我的荷兰旗实现比我的Hoare-2分区实现慢？

[英]Quicksort - why is my dutch-flag implementation slower than my Hoare-2-partition implementation?

为什么快速排序的这种实现比qsort慢？

[英]Why is this implementation of Quick Sort slower than qsort?

为什么 MPI 和 OpenMP 合并排序比我的顺序代码慢？

[英]Why MPI and OpenMP Merge Sort are slower than my sequential code?

为什么我的 selectionSort 实现比我的 bubbleSort 实现快？

[英]Why is my implementation of selectionSort faster than my implementation of bubbleSort?

OpenMP部分比单线程运行得慢

[英]OpenMP sections run slower than single thread

Dijkstra算法OpenMP比单线程慢

[英]Dijkstra Algorithm OpenMP Slower than Single Thread

为什么POSIX线程比OpenMP慢

[英]Why POSIX Threads are Slower Than OpenMP

OpenMP和GSL RNG - 性能问题 - 4个线程实现比纯序列1（四核CPU）慢10倍

[英]OpenMP and GSL RNG - Performance Issue - 4 threads implementation 10x slower than pure sequential one (quadcore CPU)

模运算符比手动执行慢？

[英]Modulo operator slower than manual implementation?

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 为什么我的OpenMP实现比单线程实现慢？（跟进） Quicksort - 为什么我的荷兰旗实现比我的Hoare-2分区实现慢？为什么快速排序的这种实现比qsort慢？为什么 MPI 和 OpenMP 合并排序比我的顺序代码慢？为什么我的 selectionSort 实现比我的 bubbleSort 实现快？ OpenMP部分比单线程运行得慢 Dijkstra算法OpenMP比单线程慢为什么POSIX线程比OpenMP慢 OpenMP和GSL RNG - 性能问题 - 4个线程实现比纯序列1（四核CPU）慢10倍模运算符比手动执行慢？

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM