簡體   English   中英

分析任意 CUDA 應用程序

[英]Profiling arbitrary CUDA applications

我當然知道nvvpnvprof的存在,但由於各種原因nvprof不想使用我的應用程序,其中涉及大量共享庫。 nvidia-smi可以連接到驅動程序以找出正在運行的內容,但是我找不到讓nvprof附加到正在運行的進程的好方法。

有一個標志--profile-all-processes它實際上給了我一條消息“NVPROF 正在分析進程 12345”,但沒有進一步打印出來。 我正在使用 CUDA 8。

在這種情況下,如何獲得 CUDA 內核的詳細性能分解?

正如評論所建議的,您只需確保在要分析的進程之前啟動 CUDA 分析器(現在是 NSight Systems 或 NSight Compute,不再是 nvprof)。 例如,您可以將其配置為在系統啟動時運行。

您無法分析您的應用程序與它是“涉及大量共享庫的應用程序”無關 - 分析工具對此類應用程序進行分析就好了。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM