簡體   English   中英

如何使用 python 和 numba 在 RTX GPU 中對 NVIDIA 的張量核心進行編程?

[英]How to program NVIDIA's tensor cores in RTX GPU with python and numba?

我有興趣在 python 中使用來自 NVIDIA RTX GPU 的張量核心,以受益於它在某些科學計算中的加速。 Numba 是一個很棒的庫,它允許為 cuda 編程內核,但我還沒有找到如何使用張量內核。 可以用 Numba 完成嗎? 如果沒有,我應該使用什么?

....我還沒有找到如何使用張量核心。 可以用 Numba 完成嗎?

不,Numba 目前在設備代碼中沒有半精度支持或張量核心內在函數。

如果沒有,我應該使用什么?

我認為您將無法在本地 C++ 方言中編寫 kernel 代碼,然后使用 PyCUDA 之類的東西來運行從該 C++ 方言編譯的設備代碼。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM