CUDA的cudaMemcpyToSymbol（）抛出“无效参数”错误

Question

问题

我正在尝试将int数组复制到设备的常量内存中，但我不断收到以下错误：

[错误]'无效参数'（11）在'main.cu'第'386行'

编码

开发了很多代码，所以我将简化我的工作。

我已经在main.cu文件的顶部声明了一个设备__constant__变量，在任何函数之外。

__device__ __constant__ int* dic;

我还有一个宿主变量flatDic ，它在main()以下面的方式进行flatDic ：

int* flatDic = (int *)malloc(num_codewords*(bSizeY*bSizeX)*sizeof(int));

然后我尝试将flatDic的内容复制到dic ，同样在main() ：

cudaMemcpyToSymbol(dic, flatDic, num_codewords*(bSizeY*bSizeX)*sizeof(int));

这个cudaMemcpyToSymbol()调用它是main.cu的第386行，它就是抛出上述错误的地方。

我试过的

这是我迄今为止尝试解决问题的方法：

我已经尝试了以下所有内容，总是返回相同的错误：

cudaMemcpyToSymbol(dic, &flatDic, num_codewords*(bSizeY*bSizeX)*sizeof(int));

cudaMemcpyToSymbol(dic, flatDic, num_codewords*(bSizeY*bSizeX)*sizeof(int));

cudaMemcpyToSymbol(dic, &flatDic, num_codewords*(bSizeY*bSizeX)*sizeof(int), 0, cudaMemcpyHostToDevice);

cudaMemcpyToSymbol(dic, flatDic, num_codewords*(bSizeY*bSizeX)*sizeof(int), 0, cudaMemcpyHostToDevice);

在调用cudaMemcpyToSymbol()之前，我还尝试过cudaMalloc()的dic变量。 cudaMalloc()不会抛出任何错误，但cudaMemcpyToSymbol()错误仍然存在。

cudaMalloc((void **) &dic, num_codewords*(bSizeY*bSizeX)*sizeof(int));

我也广泛搜索网络，文档，论坛，示例等，但都无济于事。

有人看到我的代码有什么问题吗？ 提前致谢。

Answer 1

cudaMemcpyToSymbol复制到一个常量变量，这里你试图将int类型的多个字节（一个已分配的ARRAY）复制到int *类型的指针。 这些类型不一样，因此invalid type 。 为了使这个工作，你需要将一个int （已分配）的ARRAY复制到设备（静态长度）的ARRAY of int （常量），例如：

__device__ __constant__ int dic[LEN];

来自CUDA C编程指南的示例（我建议您阅读 - 它非常好！）：

__constant__ float constData[256];
float data[256];
cudaMemcpyToSymbol(constData, data, sizeof(data));
cudaMemcpyFromSymbol(data, constData, sizeof(data));

据我所知，你也可以cudaMemcpyToSymbol一个指向指针的指针（不像你的例子，你将数组复制到指针），但要注意指针将是常量，而不是它指向你设备的内存。 如果你要去这条路线，你需要添加一个cudaMalloc ，然后cudaMemcpyToSymbol将所得到的ptr添加到你的__constant__设备var的设备内存中。 AGAIN，在这种情况下，数组值不会是常量 - 只有指向内存的指针。

您对此案件的要求如下：

int * d_dic;
cudaMalloc((void **) &d_dic, num_codewords*(bSizeY*bSizeX)*sizeof(int));
cudaMemcpyToSymbol(c_dic_ptr, &d_Dic, sizeof(int *));

此外，您应该在调试内部错误检查逻辑中包装CUDA调用。 我从talonmies借用了以下逻辑：

__inline __host__ void gpuAssert(cudaError_t code, char *file, int line, 
                 bool abort=true)
{
   if (code != cudaSuccess) 
   {
      fprintf(stderr,"GPUassert: %s %s %d\n", cudaGetErrorString(code),
          file, line);
      if (abort) exit(code);
   }
}

#define gpuErrchk(ans) { gpuAssert((ans), __FILE__, __LINE__); }

要调用简单地将CUDA调用包装在其中，如下所示：

gpuErrchk(cudaMemcpyToSymbol(dic, flatDic, num_codewords*(bSizeY*bSizeX)*sizeof(int)));

如果您遇到分配问题或其他常见错误，编程将退出并显示错误消息。

要检查内核，请执行以下操作：

MyKernel<<<BLK,THRD>>>(vars...);

//Make sure nothing went wrong.
gpuErrchk(cudaPeekAtLastError());
gpuErrchk(cudaDeviceSynchronize());

感谢talonmies的错误检查代码！

注意：
即使您正在使用vanilla cudaMemcpy ，您的代码也会失败，因为您没有cudaMalloc内存用于您的阵列 - 但在这种情况下，失败可能是GPU相当于段Unspecified launch failure （可能是Unspecified launch failure ）指针会有一些垃圾值，你会尝试用该垃圾值给出的地址写入内存。

CUDA的cudaMemcpyToSymbol（）抛出“无效参数”错误

问题描述

1 个解决方案

解决方案1
4 已采纳 2012-03-13 03:27:12

CUDA的cudaMemcpyToSymbol（）抛出“无效参数”错误

问题描述

1 个解决方案

解决方案1 4 已采纳 2012-03-13 03:27:12

解决方案1
4 已采纳 2012-03-13 03:27:12