![](/img/trans.png)
[英]Cannot use cuMemcpyHtoDAsync and cuMemcpyDtoHAsync at the same time
我對以下代碼片段有一個相當奇怪的觀察。 當我兩者都做時 - 將 memory 復制到設備並將結果復制回主機時,流似乎是同步的 - 即它們按順序執行 kernel。 一旦我將副本刪除到主機並將參數復制到設備,流將並行執行,一旦我刪除復制參數並繼續復制結果,流也將並行執行。 任何想法為什么? 以及如何 ...
[英]Cannot use cuMemcpyHtoDAsync and cuMemcpyDtoHAsync at the same time
我對以下代碼片段有一個相當奇怪的觀察。 當我兩者都做時 - 將 memory 復制到設備並將結果復制回主機時,流似乎是同步的 - 即它們按順序執行 kernel。 一旦我將副本刪除到主機並將參數復制到設備,流將並行執行,一旦我刪除復制參數並繼續復制結果,流也將並行執行。 任何想法為什么? 以及如何 ...
[英]Jcuda CUDA_ERROR_LAUNCH_OUT_OF_RESOURCES (Too Many Parameters?)
當我調用 function、cuLaunchKernel() 時,我的程序因錯誤 CUDA_ERROR_LAUNCH_OUT_OF_RESOURCES 而崩潰。 這是因為我將 29 個參數傳遞給我的 kernel? 如果是這樣,是否有任何解決方法? 我很確定我需要這些參數進行計算。 ...
[英]How to execute this same function on CPU and GPU with JCuda
我處理 JCuda 文檔中的代碼。 目前,它只是在 GPU 上添加向量。 我應該怎么做才能重用 function add到 CPU(主機)? 我知道,我必須將__global__更改為__host__ __device__但我不知道如何在我的主要 function 中調用它。 我懷疑我必須使用另一 ...
[英]How to solve 'Maven cannot resolve dependencies' on ARM architecture?
我的Java項目在古典體系結構(即馮·諾依曼體系結構)上正常工作。 但是,maven無法解決對我的Jetson AGX的依賴關系,即ARM體系結構。 在ARM體系結構上編譯項目時,我需要更改什么? Maven上是否有相應的軟件包? pom.xml: 出現以下錯誤: ...
[英]Is it possible to send data to GPU memory which is defined as Union, from JCuda?
我在GPU端(cuda)中定義了這樣的新數據類型: 在Java中,我們擁有定義的並集中可用數組之一的數組。 通常,如果我們有一個int類型的數組,則可以在Java(JCuda)中執行以下操作: 但是,如果設備上的數組類型是我們的聯合,該怎么辦呢? (假設h_array仍然是i ...
[英]Exception in thread “main” java.lang.NoClassDefFoundError: jcuda/driver/JCudaDriver
我正在嘗試設置JCuda並執行示例附加內核。 當我嘗試在編譯JCudaVectorAdd.java之后執行JCudaVectorAdd時,出現以下錯誤: 我已經按照執行的步驟創建了一個bash文件,以到達我所在的位置: 盡管我對java或cuda / jcuda不夠熟悉,無法識 ...
[英]How to compile and run JCUDA in netbeans?
我想在Ubuntu 16.04上的IDE(Netbeans)中編譯並運行我的jcuda代碼。 我已經安裝了Netbeans,Maven,java和cuda 8.0。 例如,我想運行vector add的示例,其java文件是JCudaVectorAdd.java ,而cuda內核是JCu ...
[英]No JCudaRuntime-0.9.2-windows-x86_64 in java.library.path when trying to run JCuda sample
我已經在Gradle中導入了以下庫: 並從JCuda頁面復制粘貼的JCublasSampleexample 。 不幸的是,我收到以下錯誤: 當然,圖書館是不存在的。 問題是如何將其鏈接到Maven / Gradle? 網站說所有DLL應該在JAR內。 CUDA已安 ...
[英]cuCtxCreate fails if NVIDIA control panel sets optimization for computing
我通過JCuda API運行CUDA。 當我使用NVIDIA控制面板為參與的JVM可執行文件(java.exe)設置計算優化(默認情況下處於關閉狀態)時,該程序無法在對cuCtxCreate的調用中創建上下文。 為了優化,程序運行正常。 唯一的問題是每次運行時內核中的經過時間偏差過大( ...
[英]JCuda access violation when creating a texture object with the driver API
我有一個JCuda項目,它在嘗試使用驅動程序API創建紋理對象時遇到訪問沖突。 Java HotSpot聲稱該錯誤來自nvcuda.dll。 從中創建紋理的基礎CUarray似乎已正確填充。 將其內容復制回主機端float數組將導致該數組與初始主機端數據相同。 這意味着錯誤本身必須是 ...
[英]How to implement handles for a CUDA driver API library?
注意:問題已更新以解決評論中提出的問題,並強調問題的核心是關於 Runtime- 和 Driver API 之間的相互依賴關系 CUDA 運行時庫(如 CUBLAS 或 CUFFT)通常使用“句柄”的概念來概括此類庫的狀態和上下文。 使用模式非常簡單: 然而,關於這些句柄如何與驅動程序和運行時 ...
[英]Convert cudaStream_t object to CUStream object
有沒有辦法將cudaStream_t對象轉換為CUStream ? 我發現這個黑客,但我認為它不安全。 或者,有沒有辦法只在CUDA 7.5中使用cudaStream_t對象在JCuda應用程序中調用cudaLaunchKernel ? ...
[英]How do you get CUDA cores count in jcuda?
如何獲得jcuda中的CUDA內核數? 我已經嘗試過了,但是沒有產生正確的輸出: 它返回16,但是我有1個Nvidia GPU和640個cudacore。 以上屬性的JavaDoc在此處可用 。 任何幫助將不勝感激。 ...
[英]“CUDA_ERROR_ILLEGAL_ADDRESS” when executing cuCtxSynchronize() in JCUDA
我正在學習JCuda,並研究JCuda示例。 當我使用JCuda研究KMeans算法代碼時,執行cuCtxSynchronize()行時得到了“ CUDA_ERROR_ILLEGAL_ADDRESS”。 這讓我很困惑。 我該如何解決? 這是KMeansKernel.cu ...
[英]How to get CUDA event starting and ending time without using nvprof
我編寫了一些Java代碼,這些代碼使用JCuda執行一些CUDA內核。 我想對應用程序進行概要分析,以了解流是如何重疊的以及諸如此類。 我能夠使用諸如cudaEventElpasedTime之類的cuda事件調用來獲取內核的執行時間,但是我不知道如何獲取同一內核的開始和結束時間戳記。 ...
[英]CUDA out of memory message after using just ~2.2GB of memory on a GTX1080
我正在使用JCuda,版本0.8.0RC和CUDA 8.0在GTX1080 GPU上進行矩陣乘法。 我以行優先矢量形式將兩個矩陣A和B裝入設備,並從設備讀取乘積矩陣。 但是我發現我的設備內存用完了比預期的要早。 例如,如果矩陣A的尺寸為100000 * 5000 = 5億個條目=價值2GB ...
[英]JCuda's JCublas2.cublasSdot: failed to use a device Pointer for the result Pointer parameter
在源代碼的JCublas2.cublasSdot注釋中,注釋了“結果”參數可以是“主機或設備指針”。 但是,我只能使用帶float [] fs = {0}的Pointer.to(fs)之類的主機指針。 如果我使用設備指針,例如'CUdeviceptr devicePtr = new C ...
[英]CUDA_ERROR_ILLEGAL_ADDRESS when accessing variables in CUDA kernel
嘗試運行用於計算Buddhabrot分形軌道的內核時,出現CUDA_ERROR_ILLEGAL_ADDRESS異常。 我現在已經嘗試了多種方法,並且該錯誤似乎並非源於與我最初想到的相反的數組。 例如, 會很好。 但是,當我嘗試調試idx (請記住我首先以為該錯誤與數組有關), ...
[英]In Hadoop-2.6.0, container was killed for not enough virtual memory
我正在嘗試在hadoop上實現jcuda代碼,並且它在本地模式下工作,但是當我在hadoop集群上運行作業時,它給了我一個錯誤:這里的容器被殺死是特定的錯誤報告: 16/04/29 10:18:07 INFO mapreduce。任務:任務ID:try_1461835313661_0014 ...
[英]Cannot understand how jCuda cuLaunchKernel work?
我試圖了解如何在Java中使用Cuda。 我正在使用jCuda。 一切都很好,直到我遇到一個包含代碼的示例: 內核函數原型是: 問題是:就c而言,我們似乎沒有傳遞類似的東西嗎? 所以基本上,我們總是必須: 謝謝 ...