![](/img/trans.png)
[英]Check OpenCL vendor ID at kernel-compile-time?
在 OpenCL kernel 中,如果針對 NVIDIA GPU,我想做一件事,否則我想做另一件事,即 我應該放什么而不是MAGIC_HERE ? ...
[英]Check OpenCL vendor ID at kernel-compile-time?
在 OpenCL kernel 中,如果針對 NVIDIA GPU,我想做一件事,否則我想做另一件事,即 我應該放什么而不是MAGIC_HERE ? ...
[英]In NVIDIA gpu, Why is the elapse time the same as the number of thread increase to 3 times of gpu core?
這是我的cuda代碼: 我編譯我的代碼,在2080Ti上運行,我發現線程消耗時間大約是214毫秒,但是線程數是gpu核心的3倍(在2080Ti上是4352) 所以我的問題是為什么運行時間和線程數一樣增加到gpu核的3倍? 意思是NVIDIA gpu的計算能力是gpu核心的3倍? ...
[英]In NVIDIA gpu, Can ld/st and arithmetic instruction(such as int32 fp32 )run simultaneously in same sm?
尤其是圖靈和安培架構,在同一個sm和同一個warp調度器中,warp是否可以同時運行ld/st等算術指令? 我想知道 warp scheduler 是如何工作的 ...
[英]How to get instruction cost in NVIDIA GPU?
我想知道nvidia gpu有多少時鍾指令開銷,比如add, mul,ld/st等等,我該怎么做? 我寫了一些代碼在 2080Ti 上測試和運行 但是結果讓我有點疑惑,結果output是: 在 gpu 階段 1:6 0 為什么執行了這么多次 mul 指令,時鍾成本只有 6 ? nvcc 編譯器是否 ...
[英]CUDA H.265 decoder initialization fault
我正在嘗試使用 nvidia_video_codec_sdk 解碼 h.265 幀,視頻大小為 192x168,但 cuvidCreateDecoder 斷言 CUDA_ERROR_INVALID_VALUE。 我的環境 NVIDIA GeForce RTX 3060 NVIDIA-SMI 470 ...
[英]docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]]. AFTER installing nvidia-docker2
我按照官方文檔https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html 中的說明安裝了 nvidia-docker2 每當我運行他們的測試示例時: 我仍然收到錯誤: 我重新啟動但仍然沒有效 ...
[英]Compilation of OpenCV v4.5.1 using CMake on NVIDIA GTX 1660 Super / Windows10
我正在嘗試使用 CMake 為我的 1660 Super 編譯 OpenCV v4.5.1。 我已經按照 NVIDIA 網站上的說明安裝了 CUDA Toolkit v12.0 和 CUDNN v8.7.0.84。 作為記錄,我正在按照這些說明進行操作。 我使用自己的Anaconda Python ...
[英]Older driver, newer CUDA Toolkit leads to container startup failure - any configuration workarounds?
從 CUDA 11.x 開始,NVIDIA 理論上應保證其 CUDA 工具包庫(通常在 docker 容器內提供)和驅動程序庫libcuda.so (安裝在主機上)的兼容性。 至少當我們停留在 CUDA(11.0 到 11.8)的所有次要版本中時,這應該是正確的。 因此,應該可以在預裝了為舊版 C ...
[英]Parallelization of a for loop consisting of Thrust Transforms
我已經實現了一個由多個 Thrust 轉換組成的 for 循環。 我的目標是為i從 0 到N的每個值計算r[i] 。 簡單來說, r是一個列向量,它的每一個元素都可以獨立計算。 因此,我正在尋找一種並行化下面給出的 for 循環的方法:for(int i=0; i < N; i++) { ...
[英]Vulkan is unable to detect Nvidia GPU from within a docker container when using the Nvidia Container Toolkit
我的目標是能夠使用Nvidia Container Toolkit在 docker 容器中運行 Vulkan 應用程序。 理想情況下在主機和容器中運行 Ubuntu 22.04。 我創建了一個 git 存儲庫以允許其他人更好地重現此問題: https://github.com/rickyjames ...
[英]Where is the NVidia 11.8 WSL Ubuntu toolkit available for download?
在哪里可以下載 wsl2 的 11.8 cuda 工具包? 我需要道德上的等價物:wget https://developer.download.nvidia.com/compute/cuda/12.0.0/local_installers/cuda-repo-wsl-ubuntu-12-0-lo ...
[英]How to start triton server after building the Windows 10 "Min" Image?
我已按照此處提到的步驟進行操作。 我能夠構建 win10-py3-min 圖像。 之后,我正在嘗試按照此處所述構建 Triton 服務器命令: 我收到如下錯誤。 和下面的命令 出現如下錯誤。 ...
[英]Could not load dynamic library 'libnvinfer.so.7'
我知道這個問題已經被問了很多,但這些建議似乎都沒有用,可能是因為我的設置有些不同: 在目錄home/dan/anaconda3/envs/tf/lib/python3.10/site-packages/tensorrt中創建了一個 conda 環境 'tf' 當運行python3 -c "impo ...
[英]Change fan speed of NVIDIA GPU via CLI
如何在 Linux 系統上使用終端或命令行界面 (CLI) 更改 NVIDIA 圖形處理單元 (GPU) 上冷卻風扇的速度或負載? 我有興趣調整風扇速度或負載以優化我的 GPU 的溫度和性能,我想知道是否有任何可用的工具或實用程序允許我通過終端或 CLI 執行此操作。 是否可以直接更改風扇速度或負載 ...
[英]How vulkan application find the address of the function in driver
我正在研究 Vulkan 驅動程序代碼。 我想知道應用程序如何調用驅動程序函數,因為函數名稱不同。 我想知道應用程序如何調用驅動程序函數,因為函數名稱不同。 ...
[英]How to use GPU with TensorFlow?
我的電腦Microsoft Windows [Version 10.0.22621.963] (c) Microsoft Corporation. All rights reserved. C:\Users\donhu>nvcc -V nvcc: NVIDIA (R) Cuda compi ...
[英]Nano Jetson Jetpack 4.6.1 can't install right h5py version?
我有一個 Nano Jetson,並從這里用最新可用的 Jetpack 版本刷新它: https ://developer.nvidia.com/embedded/learn/get-started-jetson-nano-devkit,即 4.6.1。 現在,當按照本指南安裝 tensorflo ...
[英]Is there 1 SYCL implementation to rule all platforms?
為這個有點開玩笑的標題道歉,但我找不到另一種方式來簡潔地描述這個問題。 我在一個主要使用帶有 CPU 回退的 OpenCL 代碼的團隊中工作。 在大多數情況下,這工作正常,除了 Nvidia 和他們拒絕將 SPIR-V 用於 OpenCL。 我最近發現並一直在研究 SYCL,但圍繞它的生態系統有點 ...
[英]How to exclude error mesage from bash string
我的 xubuntu 中有命令: 我得到了結果: 如果我嘗試排除“libEGL 警告:DRI2:無法驗證”: 結果是一樣的。 如何忽略“libEGL 警告:DRI2:無法驗證”字符串? ...
[英]Read GPU Information from Console C++
我想創建自己的超頻監視器,我需要為其讀取當前電壓、時鍾速度等信息。 在 C++ 中,我可以通過鍵入輕松地從 Nvidia-smi 獲取信息,例如: console("nvidia-smi -q -i voltage"); 然后顯示我: 由此我只需要電壓編號,在本例中為“806.25”。 我對 < ...