CUDA cudaMemcpy“无效的论点”

Question

Trying to debug a larger application I'm having an issue where I can't seem to be able to copy values from the host to the device. 尝试调试更大的应用程序时，我似乎无法将值从主机复制到设备上，这是一个问题。 I provide below a minimal example which I think should copy the 6 to the device and then back. 我在下面提供了一个最小的示例， 我认为应该将6复制到设备上，然后再复制回去。

#include <stdio.h>
__device__ float a_d;

main(){
    float a = 6.0;
    float b;
    puts(cudaGetErrorString(cudaMemcpy(&a_d,&a,sizeof(float),cudaMemcpyHostToDevice)));
    puts(cudaGetErrorString(cudaMemcpy(&b,&a_d,sizeof(float),cudaMemcpyDeviceToHost)));
    printf("%e",b);
}

I get the following output with CUDA 5.5 on 64-bit Linux. 我在64位Linux上使用CUDA 5.5获得以下输出。

$ nvcc test.cu -run
invalid argument
invalid argument
0.000000e+00

whereas I'd expect cudaSuccess and 6.000000e+00 . 而我希望cudaSuccess和6.000000e+00 。

Answer 1

You cannot use cudaMemcpy directly with __device__ variables. 您不能将cudaMemcpy直接与__device__变量一起使用。 The correct API to use is cudaMemcpyTo/FromSymbol . 正确使用的API是cudaMemcpyTo/FromSymbol 。

The following should work: 以下应该工作：

#include <stdio.h>
__device__ float a_d;

main(){
    float a = 6.0;
    float b;
    puts(cudaGetErrorString(cudaMemcpyToSymbol(a_d,&a,sizeof(float)));
    puts(cudaGetErrorString(cudaMemcpyFromSymbol(&b,a_d,sizeof(float)));
    printf("%e",b);
}

It's not clear why you'd expect 0.000000e+00 . 目前尚不清楚为什么会期望0.000000e+00 。 Based on your code I would expect 6.000000e+00 , or something like that. 根据您的代码，我期望6.000000e+00或类似的值。

CUDA cudaMemcpy“无效的论点”

问题描述

1 个解决方案

解决方案1
2 已采纳 2014-10-29 20:35:13

CUDA cudaMemcpy“无效的论点”

问题描述

1 个解决方案

解决方案1 2 已采纳 2014-10-29 20:35:13

解决方案1
2 已采纳 2014-10-29 20:35:13