繁体 English 中英

Numba CUDA 运行时共享内存大小？

[英]Numba CUDA shared memory size at runtime?

原文 2015-05-28 15:14:46 3 1 python/ cuda/ numba

在 CUDA C 中，定义在运行时指定大小的共享内存很简单。 如何使用 Numba/NumbaPro CUDA 执行此操作？

到目前为止，我所做的只会导致错误消息“参数'形状'必须是常量”。

编辑：只是为了澄清，我想要的是相当于 C CUDA 中的以下内容（从这里获取并改编的示例：

__global__ void dynamicReverse(int *d, int n)
{
  extern __shared__ int s[];

  // some work in the kernel with the shared memory
}

int main(void)
{
  const int n = 64;
  int a[n];

  // run dynamic shared memory version
  dynamicReverse<<<1,n,n*sizeof(int)>>>(a, n);

}

1 个解决方案

我找到了解决方案（通过非常有用的 Continuum Analytics 用户支持）。 我们所做的是像往常一样定义共享内存，但将形状设置为 0。然后，要定义共享数组的大小，我们必须将它作为第四个参数（在流标识符之后）提供给内核。 例如：

@cuda.autojit
def myKernel(a):
   sm = cuda.shared.array(shape=0,dtype=numba.int32)

   # do stuff

arga = np.arange(512)
grid = 1
block = 512
stream = 0
sm_size = arga.size * arga.dtype.itemsize
myKernel[grid,block,stream,sm_size](arga)

Numba - CUDA kernel 中的共享 memory 未正确更新

[英]Numba - Shared memory in CUDA kernel not updating correctly

Numba CUDA 共享内存矩阵乘法

[英]Numba CUDA shared memory matrix multiplication

Numba cuda 动态共享 memory：不止一种？

[英]Numba cuda dynamic shared memory: more than one type?

Numba cuda：使用共享内存添加数字导致覆盖

[英]Numba cuda: Using shared memory to add numbers results in overwriting

如何释放Numba cuda使用的GPU memory？

[英]How to release the GPU memory used by Numba cuda?

numba 和 tensorflow 一起给出了 CUDA_ERROR_OUT_OF_MEMORY

[英]numba and tensorflow together gives CUDA_ERROR_OUT_OF_MEMORY

在 Numba 中，以 CUDA 为目标时，如何将数组复制到常量 memory 中？

[英]In Numba, how to copy an array into constant memory when targeting CUDA?

如何在 Numba 中参数化 cuda.local.array 的大小？

[英]How to parameterize the size of cuda.local.array in Numba?

我可以使用 Numba 共享的 memory 与 Cupy 一起加速吗？

[英]Could I use Numba shared memory to accelerate with Cupy？

Numba CUDA 缩减为数组

[英]Numba CUDA reduce into array

暂无

暂无

声明:本站的技术帖子网页，遵循CC BY-SA 4.0协议，如果您需要转载，请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

相关问题 Numba - CUDA kernel 中的共享 memory 未正确更新 Numba CUDA 共享内存矩阵乘法 Numba cuda 动态共享 memory：不止一种？ Numba cuda：使用共享内存添加数字导致覆盖如何释放Numba cuda使用的GPU memory？ numba 和 tensorflow 一起给出了 CUDA_ERROR_OUT_OF_MEMORY 在 Numba 中，以 CUDA 为目标时，如何将数组复制到常量 memory 中？如何在 Numba 中参数化 cuda.local.array 的大小？我可以使用 Numba 共享的 memory 与 Cupy 一起加速吗？ Numba CUDA 缩减为数组

相关标签

粤ICP备18138465号 © 2020-2024 STACKOOM.COM