[英]OpenMP parallelization stopped working
在Linux上,使用g ++ 4 7.1的AMD 8核处理器。
对我来说,这是一个危险。 以下代码运行良好,并且由于某种原因停止了并行化。 我添加了omp_get_num_procs(),它可以打印8个处理器。 我检查了编译,并且-fopenmp作为链接和编译的选项存在。 没有编译/链接错误消息。 我检查是否定义了任何环境变量(OMP_xxx)-没有。
还有其他可能影响外部的因素吗?
#pragma omp parallel
{
lightray ray;
rgba L;
printf("Max nr processors: %d\n", omp_get_num_procs());
#pragma omp for schedule(dynamic)
for (int xy = 0; xy < xy_range; xy++) {
int x = x_from + (xy % x_width);
int y = y_from + (xy / x_width);
ray = cam->get_ray_at(x, y);
L = trace_ray(ray, 0, cam->inter);
cam->set_pixel(x, y, L);
}
}
dtime = omp_get_wtime() - dtime;
printf("time %f\n", dtime);
}
编辑:我想我已经在这里找到了一些... Anjuta生成的g ++命令行包含以下内容:
-DPACKAGE_LOCALE_DIR=\""/usr/local/share/locale"\" -DPACKAGE_SRC_DIR=\"".. -fopenmp . "\"
PACKAGE_SRC_DIR定义似乎“包含”了-fopenmp标志,这会将其从g ++隐藏。 尚未找到原因...
尝试以这种方式重写它:
lightray ray;
rgba L;
printf("Max nr processors: %d\n", omp_get_num_procs());
#pragma omp parallel for schedule(dynamic) private(ray,L)
for (int xy = 0; xy < xy_range; xy++) {
int x = x_from + (xy % x_width);
int y = y_from + (xy / x_width);
ray = cam->get_ray_at(x, y);
L = trace_ray(ray, 0, cam->inter);
cam->set_pixel(x, y, L);
}
dtime = omp_get_wtime() - dtime;
printf("time %f\n", dtime);
这样,您将ray
和L
引入为特定于每个线程的变量,从而对循环进行标记。 由于默认情况下,在并行区域之外定义的变量在线程之间共享,因此您当前的实现方式是对这两个变量进行调整。
另外, omp_get_num_procs()
“返回该程序可用的处理器数量。” 根据OpenMP API 3.1 C / C ++语法快速参考卡-因此,它不一定告诉您一个区域中实际使用了多少个线程。 为此,您可能需要omp_get_num_threads()
或omp_get_thread_num()
这似乎是程序外部的问题。 我确实更改了IDE版本(Anjuta)。 Anjuta非常依赖pkg-config。 OpemMP没有pkg-config .pc文件,因此我为libgomp库制作了一个。 我将-lgomp添加到了Libs:效果很好,并且将-fopenmp添加到了两个Libs:和Cflags:效果不佳。
由于某些原因,-fopenmp被添加到称为-DPACKAGE_SRC_DIR的命令行参数中(在其引号内-参见原始消息中的编辑),因此链接器和编译器将其忽略。 我会在Anjuta论坛上问这个问题。
因此,解决方案是将其从.pc文件中删除,然后将其手动添加为项目参数“ CXXFLAGS = -fopenmp”和“ LDFLAGS = -fopenmp”(我想避免这种情况,因为下次我肯定会忘记做:)
无论如何,它是这样工作的。 感谢您的建议。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.