簡體   English   中英

如何計算CUDA線程內部矩陣的指數?

[英]How to compute exponential of a matrix inside CUDA thread?

我需要某種方式能夠計算CUDA內核中矩陣的指數。 是否有可以從CUDA線程中調用其功能的庫? 還是有可能從頭實現此功能作為__device__函數?

我正在使用Microsoft Visual Studio 2008 Express進行主機代碼編譯和工具包3.2v中的nvcc編譯器。

GPU:NVIDIA GeForce GT640(計算能力3.0)

CUDA庫中沒有這樣的東西,但是您可以查看以下代碼來幫助您在CUDA中設計解決方案:

https://github.com/poliu2s/MKL/blob/master/matrix_exponential.cpp

如果你是在一個架構3.5工作,它可能是更容易通過調用來解決問題(動態paralleslism) __global__從其他內核__global__內核,而不返回主機上,因此您可以設置要執行它的配置(線程和塊)。

基本上:

__global__ child( ... ) 
{
   ....
}

__global__ parent( ... )
{
   child<<< ..., ... >>>( ... )
}

希望這可以幫助

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM