CUDA使用cudaMemcpy复制多个结构数组

Question

假设结构X具有一些基本元素和Y结构数组：

typedef struct 
{ 
   int a;    
   Y** y;
} X;

X的实例X1在主机上初始化，然后通过cudaMemcpy复制到设备内存上的X的实例X2。

这对于X中的所有原语（例如int a）都可以正常工作，但是cudaMemcpy似乎将任何双指针都扁平化为单个指针，因此，只要在X中可以访问结构数组（例如y），就会导致超出范围的异常。。

在这种情况下，我应该使用另一个memcpy函数，例如cudaMemcpy2D或cudaMemcpyArrayToArray吗？

建议非常感激。 谢谢！

编辑

复制结构数组的自然方法（如“如果只是C，这就是我要做的事情”）将是cudaMalloc该数组，然后cudaMalloc并分别初始化每个元素，例如：

X** h_x;
X** d_x;
int num_x;

cudaMalloc((void**)&d_x, sizeof(X)*num_x);

int i=0;
for(;i<num_x;i++)
{
    cudaMalloc((void**)d_x[i], sizeof(X));
    cudaMemcpy(&d_x[i], &h_x[i], sizeof(X), cudaMemcpyHostToDevice);
}

但是，for的cudaMalloc会导致崩溃。 我承认我对使用Cuda函数中的指针还不满意，所以也许我搞砸了cudaMalloc和cudaMemcpy参数？

Answer 1

cudaMemcpy ， cudaMemcpy2D和cudaMemcpyArrayToArray都从主机中的连续内存区域复制到设备上的连续内存区域。

您必须将所有数据复制到发送到设备的中间连续缓冲区中。

CUDA使用cudaMemcpy复制多个结构数组

问题描述

1 个解决方案

解决方案1
4 已采纳 2013-07-22 00:41:54

CUDA使用cudaMemcpy复制多个结构数组

问题描述

1 个解决方案

解决方案1 4 已采纳 2013-07-22 00:41:54

解决方案1
4 已采纳 2013-07-22 00:41:54