[英]How to return a single variable from a CUDA kernel function?
我有一个CUDA搜索功能,可以计算一个变量。 我怎么能把它还给我。
__global__
void G_SearchByNameID(node* Node, long nodeCount, long start,char* dest, long answer){
answer = 2;
}
cudaMemcpy(h_answer, d_answer, sizeof(long), cudaMemcpyDeviceToHost);
cudaFree(d_answer);
对于这两行我得到这个错误:错误:类型“long”的参数与类型“const void *”的参数不兼容
我一直在使用__device__
变量来实现这个目的,这样你就不必费心使用cudaMalloc
和cudaFree
,你不必将指针作为内核参数传递,这样就可以在内核中保存一个寄存器来启动。
__device__ long d_answer;
__global__ void G_SearchByNameID() {
d_answer = 2;
}
int main() {
SearchByNameID<<<1,1>>>();
typeof(d_answer) answer;
cudaMemcpyFromSymbol(&answer, "d_answer", sizeof(answer), 0, cudaMemcpyDeviceToHost);
printf("answer: %d\n", answer);
return 0;
}
要获得单个结果,您必须对其进行Memcpy,即:
#include <assert.h>
__global__ void g_singleAnswer(long* answer){ *answer = 2; }
int main(){
long h_answer;
long* d_answer;
cudaMalloc(&d_answer, sizeof(long));
g_singleAnswer<<<1,1>>>(d_answer);
cudaMemcpy(&h_answer, d_answer, sizeof(long), cudaMemcpyDeviceToHost);
cudaFree(d_answer);
assert(h_answer == 2);
return 0;
}
我想错误来了,因为你传递一个long值,而不是指向long值的指针。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.