[英]How to compute exponential of a matrix inside CUDA thread?
我需要某種方式能夠計算CUDA內核中矩陣的指數。 是否有可以從CUDA線程中調用其功能的庫? 還是有可能從頭實現此功能作為__device__
函數?
我正在使用Microsoft Visual Studio 2008 Express進行主機代碼編譯和工具包3.2v中的nvcc編譯器。
GPU:NVIDIA GeForce GT640(計算能力3.0)
CUDA庫中沒有這樣的東西,但是您可以查看以下代碼來幫助您在CUDA中設計解決方案:
https://github.com/poliu2s/MKL/blob/master/matrix_exponential.cpp
如果你是在一個架構3.5工作,它可能是更容易通過調用來解決問題(動態paralleslism) __global__
從其他內核__global__
內核,而不返回主機上,因此您可以設置要執行它的配置(線程和塊)。
基本上:
__global__ child( ... )
{
....
}
__global__ parent( ... )
{
child<<< ..., ... >>>( ... )
}
希望這可以幫助
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.