[英]CUDA PTX, driver api - how to get global variable from kernel after execution
這是內核代碼的一部分-聲明每個線程的變量和所需的操作
.global.f32 sum = 0.0
.reg.f32 reg;
atom.global.add.f32 reg, [sum], val;
我想在每個線程中將不同的變量添加到全局變量總和中。 我認為上面發布的代碼是正確的-一切都能順利編譯。 但是我在將全局變量總和的值返回給主機方面遇到問題。
內核執行后,我得到了主機的以下代碼。
CUdeviceptr hostSumPtr;
size_t bytes;
cuModuleGetGlobal(&hostSumPtr, &bytes, hModule, "sum");
但是返回錯誤代碼500“ CUDA_ERROR_NOT_FOUND”
是否有任何方法可以將內核中聲明的全局變量的值獲取給主機,或者有任何方法可以通過其他方法繞過此問題?
有3個問題:
問題已解決。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.