标签[pgi-accelerator] - 堆栈内存溢出

使用嵌套 OpenACC 例程传递参考参数 - Reference Argument Passing with Nested OpenACC Routines

我正在尝试使用 OpenACC 并行化一些 Fortran 90 代码，其中并行化循环调用顺序例程。当我尝试使用 PGI Fortran 编译器 (2020.4) 运行代码时，我收到一条错误消息，指出传递引用参数会阻止并行化。我的理解是，这可能是因为一个例程存在于主机上，而另一个例程存在于设备 ...

简单 OpenACC 内核中向量子句的非法上下文 - Illegal context for vector clause in simple OpenACC kernel

我正在尝试编译一个简单的 OpenACC 基准测试：使用 Nvidia HPC SDK 21.5 并遇到错误知道什么可能导致这种情况吗？据我所知，我的vector(128)语法是合法的。 ...

OpenACC Fortran 循环中的顺序点积 - Sequential dot_product in OpenACC Fortran loop

在 Fortran 程序中，我有一个大循环，在循环内生成的小向量上有几个dot_product调用：当使用 PGI 编译器编译时，似乎dot_product的加速实现使用了加速循环，因此可以更好地防止主循环加速（在 gang 和 vector 上）：从日志中可以看出，它对循环私有向量使用隐式缩减 ...

OpenACC Fortran 循环中的 Matmul - Matmul in OpenACC Fortran loop

使用 PGI 编译器通过 OpenACC 加速 Fortran 代码，我在加速循环中遇到了matmul调用问题。在简化示例中，我将单位矩阵应用于两个向量，因此输入和 output 值应该相同：使用 PGI 编译器 20.9 版进行编译时，我得到了以下信息：运行代码会给出以下值：第二行应该和 ...

获取 OpenACC 免费（或全部）设备 memory - Obtain OpenACC free (or total) device memory

我有一个 GPU 代码，在每次迭代时，它决定是否可以将迭代卸载到加速器。 OpenACC 成为最好的工具：void module(struct my_aos *aos, int n_aos){ int criteria = /* check either that n_aos is l ...

带有意图输出参数的 OpenACC 例程向量 - OpenACC routine vector with intent out argument

我目前正在加速 Fortran 代码，其中我在子程序sub中有一个主加速循环。在循环中，我想用acc routine调用设备上的子程序subsub 。子例程有一个intent(out)参数val ，它在循环中是私有的。由于subsub本身有一个循环，我想使用vector子句：module ca ...

Fortran-OpenACC 包含的子程序如何从父子程序访问数据 - How can Fortran-OpenACC contained subroutine access data from parent subroutine

我目前正在加速 Fortran 代码，其中包含的子例程 ( subsub ) 访问和修改父子例程 ( sub ) 中声明的变量：module mod implicit none contains subroutine sub integer :: var(10) intege ...

PGI 编译器的未知库 - Unknown libraries for PGI compiler

我已经为加速器 (20.9) 安装了 PGI 编译器，但是一个应用程序的编译找不到 3 个库nvhpcatm.so 、 nvcpumath.so和nvc.so 。我想知道是否有人熟悉这些库中的任何一个或它们应该如何构建。谢谢。 ...

OpenACC 第一个私有变量 - OpenACC firstprivate variables

我在 OpenACC 内核中遇到数组问题。这是演示代码：当我用nvfortran -acc -Minfo=accel test.f90编译它并运行时，它显示在设备上数组中的值为 0.0，而不是我在主机端设置的正确值 1.0。这仅发生在数组中：标量，如示例中所示，具有正确的值。我想知道这 ...

acc 并行区域内的例程 - Routines inside acc parallel region

在阅读了这个how-can-a-fortran-openacc-routine-call-another-fortran-openacc-routine 之后，我仍然对这个 OpenACC 函数调用限制感到困惑。以下是来自上述链接帖子的修改后的废话代码：当我用nvfortran 20.7 ...

从 Rust 调用 OpenACC 代码不在 GPU 上运行 - Calling OpenACC code from Rust does not run on GPU

更新 09/07/2020 我在https://gitlab.com/lisanhu2016/rust-openacc-example.git添加了一个小例子这是一个带有 README 的公共存储库，您应该可以在那里尝试示例。我一直链接到的库是：nvc、achost、pgm，你可以在buil ...

如何直接（不使用指针作为函数参数）访问 OpenAcc 计算区域中 GPU 上的数组？ - How to directly (not using a pointer as a function parameter) access arrays on GPU in OpenAcc compute regions?

我有以下简单的代码，由 4 个文件组成：它在带有 PGI 19.4 编译器的 CPU 上正常工作。但我的任务是在 GPU 上启动代码。我使用 PGI 19.4 + OpenAcc。使用一个简单的CMakeLists.txt文件和编译行（GPU Nvidia GeForce 650 Ti， ...

为什么在此代码中获得设备[1]的当前表转储：NVIDIA Tesla GPU 0？ - Why I get Present table dump for device[1]: NVIDIA Tesla GPU 0 in this code?

这是头文件DataHolder.h：我在main.cpp文件中使用它：该程序可以编译，但是失败： sizeof（DataHolder）= 7 MB hostptr = 0x501520000，stride = 1，size = 2000000，eltsize = 4 ...

OpenACC-pgcc编译器中的-ta是什么意思？ - OpenACC - What does -ta in pgcc compiler mean?

尊敬的StackOverflow社区，为了使用OpenACC使用GPU加速，我在pgi编译器中遇到“ -ta”标志。我没有找到任何全面的答案。是的，我知道使用有关硬件的信息来增强它称为目标加速器。因此，如果我的GPU硬件为：-ta，我应该设置什么？用于pgi编译器（ ...

带有指针的嵌套类值得openACC - nested classes with pointers woth openACC

我在C ++中有一个相当大的代码，我必须将一些新类集成到基类中，如下所示。我认为我正在遇到深度复制问题，因为类B的指针无效，因此未定义GPU上代码的行为。对于在不涉及深层复制问题的情况下如何将类包含在另一个类中的反馈，我将不胜感激。我怀疑更新设备（此）是由某种原因引起的。 ...

PGI 18.1和PGI 18.4 - PGI 18.1 vs PGI 18.4

关于#pragma例程seq，从PGi版本18.1到18.4有什么变化，我使用的代码在版本18.1上工作正常，但在使用较新版本时却出错。我使用数学库生成内核。使用名称空间std; #pragma acc例程double myfunc（double x）{return（fabs（x） ...

OpenACC：每个GPU线程都有一个专用数组 - OpenACC: having a private array for every GPU thread

我正在将代码带入GPU。此代码具有使用私有数组的内核。这意味着该数组在内核循环内声明。当我将代码移植到OpenACC时，会得到错误的结果。对我来说，该数组似乎在GPU向量线程之间共享，这会导致一些竞争情况。我用外部调用来组织下面的示例，因为这就是我的原始代码的样子。 ...

什么是“ PGC-I-0222-符号的冗余定义” - what is “PGC-I-0222-Redundant definition for symbol”

如何解决pgcc＆openacc链接器错误“ __pgi_uacc_multicorestart”，“ __ pgi_uacc_multicoreend” 这是上述问题之后的后续问题。在“将lbe.c编译为lbe.o消息：”中，我总是看到“ PGC-I-0222-冗余定义”消息。 ...

如何解决pgcc＆openacc链接器错误“ __pgi_uacc_multicorestart”，“ __ pgi_uacc_multicoreend” - how to solve pgcc&openacc linker error “__pgi_uacc_multicorestart”, “__pgi_uacc_multicoreend”

我正在尝试在Ubuntu 16.04 LTS上使用OpenACC 2.5将C中的程序并行化。经过简单的修改（仅添加一行），我可以将所有.c文件编译为.o文件。在链接步骤中，pgcc编译器显示未定义对__pgi_uacc_multicorestart的引用和 ...

如何使用C / OpenACC和PGI编译器声明全局动态数组 - How to declare a global dynamic array with C/OpenACC with PGI compiler

我正在尝试运行一个简单的测试用例，其中动态分配的数组A被外部定义，并使用OpenACC上传到GPU。全部带有PGI编译器。我的header.h文件：然后，我的header.c实现：然后，在main.c我有我使用以下命令编译代码：我的PGI编译器 ...