cost 255 ms
PyCuda 索引 Numpy 整数数组中的错误 - Errors in PyCuda indexing Numpy array of integers

我正在将我的第一步移入 PyCuda 以执行一些并行计算,但遇到了我不理解的行为。 我从可以在 PyCuda 官方网站上找到的非常基本的教程开始(一个简单的脚本,可以将数组https://documen.tician.de/pycuda/tutorial.html的所有元素加倍)。 代码如下: 很清 ...

为什么sudo下导入pycuda.driver会导致“libcurand.so.10: cannot open shared object file: No such file or directory” - Why does importing pycuda.driver under sudo lead to "libcurand.so.10: cannot open shared object file: No such file or directory"

我正在尝试在 python 脚本中导入 pycuda-2021.1。 我的操作系统是 Ubuntu 18.04。 我安装了 cuda 工具包 11.2,我的 nvidia 驱动程序版本是 460.27.04。 我的 python 解释器是 Python 3.8。 当我执行 我似乎能够在不执行 su ...

2022-04-10 17:49:33   1   196    cuda / pycuda  
如何在pycuda中设置stream的优先级? - How to set the priority of a stream in pycuda?

标题说明了一切,但这是我的问题的更详细信息:我正在 python + pycuda 中实现一个应该在分布式系统上运行的有限元求解器。 为了隐藏通信延迟,我试图重叠计算和通信(使用 2 个独立的流)。 我的问题是用于通信的内核(在一个流上)是在主要计算 kernel 结束时执行的(见下图)。 我的 ...

为 Pycuda 发布 memory - Release memory for Pycuda

如何在 Pycuda function 调用后释放 memory? 例如在下面,我如何释放 a_gpu 使用的 memory 那么我将有足够的 memory 分配给 b_gpu 而不是出现如下错误? 我尝试from pycuda.tools import PooledDeviceAllocatio ...

通过 GPU 内核并行化 Pandas df.iterrows() - Paralleize Pandas df.iterrows() by GPU kernel

我编写了一个 python 程序,在该程序中我需要检查给定值是否在给定数据集的列中。 为此,我需要遍历每一行并检查每一行中列的相等性。 这需要很多时间,因此我想在 GPU 中运行它。 我有 CUDA C/C++ 的经验,但没有 PyCuda 的并行化经验。 谁能帮我解决这个问题? 注意:这是 ...


 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM