cuda中矢量加法的分段故障

Question

我正在搞亂cuda的玩具程序。

我聲明一個浮點數組傳遞到gpu和一個數字到該浮點數組的每個元素，並將其傳回主機系統並打印數組。 然而，這沒有成功，它給我分段錯誤。

這是代碼

#include <iostream>
using namespace std;

__global__ void kern(float *a, float *C){
    for (int i = 0; i < 3; i++) C[i] = a[i] + i;
}

int main(){
    float *A = new float[3];
    for(int i = 0; i < 3; i++){
        A[i] = i;
    }

    float * d;
    float * C;
    cudaMalloc(&C, sizeof(float)*3);
    cudaMalloc(&d, sizeof(float)*3);
    cudaMemcpy(&d, A, sizeof(float)*3, cudaMemcpyHostToDevice);
    kern<<<1, 1>>>(d, C);

    cudaMemcpy(&A, C, sizeof(float)*3, cudaMemcpyDeviceToHost);

    cout << A[2];

}

另外我對Malloc不熟悉我的大部分經驗都是使用cpp，因此我對新的數據類型[]感覺更舒服; Cuda還有相同的東西嗎？

Answer 1

將其更改為：

cudaMemcpy(&d, A, sizeof(float)*3, cudaMemcpyHostToDevice);
cudaMemcpy(&A, C, sizeof(float)*3, cudaMemcpyDeviceToHost);

對此：

cudaMemcpy(d, A, sizeof(float)*3, cudaMemcpyHostToDevice);
cudaMemcpy(A, C, sizeof(float)*3, cudaMemcpyDeviceToHost);

此外，通過CUDA調用存儲返回代碼總是更好，它們可以讓您更好地了解出現了什么問題。

cuda中矢量加法的分段故障

問題描述

1 個解決方案

解決方案1
3 已采納 2014-11-05 11:19:54

cuda中矢量加法的分段故障

問題描述

1 個解決方案

解決方案1 3 已采納 2014-11-05 11:19:54

解決方案1
3 已采納 2014-11-05 11:19:54