从c调用cuda导致错误

Question

我收到的错误是：

在此范围内，未在“ <”令牌之前的预期主表达式中声明“ blockIdx”

'>'标记之前的预期主要表达式

'<'标记之前的预期主要表达式

'>'标记之前的预期主要表达式

（“ <，>”是指内核调用<<< >>>）

另外，在主要功能中，我收到：

错误：无法将参数'1'的'float * '转换为'float '到'void kernel_wrapper（float *，float *，int，int）

cu文件：

#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <math.h>
#include <curand_kernel.h>
#include <cuda_runtime.h>
#include <cuda.h>

.....
__global__ void kernel(float* A,float *B, curandState* globalState, int Asize,int Bsize)
{
...

void kernel_wrapper(float* A_host,float* B_host, int Asize ,int Bsize)
{
...
//allocate host memory 
    A_host=(float*)malloc(Asize*sizeof(float));
    B_host=(float*)malloc(Bsize*sizeof(float));

    //allocate device memory
    float* A_dev,*B_dev;
    cudaMalloc((void**) &A_dev,Asize* sizeof(float));
    cudaMalloc((void**) &B_dev,Bsize* sizeof(float));
....

 kernel<<<1,1>>>(A_host,B_host, devStates,Asize,Bsize);
...

C文件：

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/time.h>
#include <string.h>
#include <assert.h>
#include <stdarg.h>
#include <cuda.h>
#include <cuda_runtime.h>
#include "solve.cu"


extern void kernel_wrapper(float* A,float* B, int Asize ,int Bsize);
...
int main()
{...
A = (float*)malloc(N*N*sizeof(float));
B = (float*)malloc(N*HS*sizeof(float));
...
kernel_wrapper(A,B,Asize ,Bsize);
...

我编译为：

 g++ -o mycode myfile.c -I/usr/local/cuda-5.5/include -L/usr/local/cuda-5.5/lib64 -lcurand -lcutil -lcudpp -lcuda -lstdc+

Answer 1

您不能在.c文件中包含包含设备代码（例如内核）的solve.cu ，然后使用g++对其进行正确编译

设备代码必须由nvcc编译

相反，您将需要分别编译两个文件，然后将它们链接在一起。

我建议将您的myfile.c重命名为myfile.cpp

还要从myfile.cpp 删除这一行：

#include "solve.cu"

然后编译：

nvcc -c solve.cu
g++ -c -I/usr/local/cuda-5.5/include  myfile.cpp 
g++ -o mycode solve.o myfile.o -L/usr/local/cuda-5.5/lib64 -lcudart -lcurand -lcutil -lcudpp -lcuda

对于最后一个问题，您正在传递双指针（ ** ）：

kernel_wrapper(&A,&B,Asize ,Bsize);

原型期望单个指针（ * ）：

extern void kernel_wrapper(float* A,float* B, int Asize ,int Bsize);

A和B 已经是float *类型的，因此在我看来，您应该直接将它们传递给：

kernel_wrapper(A,B,Asize ,Bsize);

编辑：回应以下问题。

的问题是，指针A_host和B_host （参数kernel_wrapper 正在值内核包装函数通过），和内核包装函数是为那些指针分配存储，但是新修改的指针反映分配的存储不是（不能）传递回调用函数（即调用kernel_wrapper的函数）。

您可以在调用函数中为A_host和B_host分配存储，然后传递指针（然后无需在kernel_wrapper malloc这些指针），也可以按如下方式修改内核包装器：

void kernel_wrapper(float** A_host,float** B_host, int Asize ,int Bsize)
{
...
//allocate host memory 
    *A_host=(float*)malloc(Asize*sizeof(float));
    *B_host=(float*)malloc(Bsize*sizeof(float));

    //allocate device memory
    float* A_dev,*B_dev;
    cudaMalloc((void**) &A_dev,Asize* sizeof(float));
    cudaMalloc((void**) &B_dev,Bsize* sizeof(float));
....
 cudaMemcpy(A_dev, *A_host, Asize*sizeof(float), cudaMemcpyHostToDevice);
 cudaMemcpy(B_dev, *B_host, Bsize*sizeof(float), cudaMemcpyHostToDevice);

 kernel<<<1,1>>>(A_dev,B_dev, devStates,Asize,Bsize);
...

然后，您还需要修改.cpp文件中的呼叫行：

int main()
{...
  float *A, *B;
  int Asize = N*N;
  int Bsize = N*NHS;
...
  kernel_wrapper(&A,&B,Asize ,Bsize);
...

现在，您的代码发布方式是，您对A和B分别执行两次malloc操作，这不是必需的。

从c调用cuda导致错误

问题描述

1 个解决方案

解决方案1
3 已采纳 2014-02-14 15:41:48

从c调用cuda导致错误

问题描述

1 个解决方案

解决方案1 3 已采纳 2014-02-14 15:41:48

解决方案1
3 已采纳 2014-02-14 15:41:48