cost 275 ms
不能同時使用 cuMemcpyHtoDAsync 和 cuMemcpyDtoHAsync

[英]Cannot use cuMemcpyHtoDAsync and cuMemcpyDtoHAsync at the same time

我對以下代碼片段有一個相當奇怪的觀察。 當我兩者都做時 - 將 memory 復制到設備並將結果復制回主機時,流似乎是同步的 - 即它們按順序執行 kernel。 一旦我將副本刪除到主機並將參數復制到設備,流將並行執行,一旦我刪除復制參數並繼續復制結果,流也將並行執行。 任何想法為什么? 以及如何 ...

Jcuda CUDA_ERROR_LAUNCH_OUT_OF_RESOURCES(參數太多?)

[英]Jcuda CUDA_ERROR_LAUNCH_OUT_OF_RESOURCES (Too Many Parameters?)

當我調用 function、cuLaunchKernel() 時,我的程序因錯誤 CUDA_ERROR_LAUNCH_OUT_OF_RESOURCES 而崩潰。 這是因為我將 29 個參數傳遞給我的 kernel? 如果是這樣,是否有任何解決方法? 我很確定我需要這些參數進行計算。 ...

如何使用 JCuda 在 CPU 和 GPU 上執行相同的 function

[英]How to execute this same function on CPU and GPU with JCuda

我處理 JCuda 文檔中的代碼。 目前,它只是在 GPU 上添加向量。 我應該怎么做才能重用 function add到 CPU(主機)? 我知道,我必須將__global__更改為__host__ __device__但我不知道如何在我的主要 function 中調用它。 我懷疑我必須使用另一 ...

如何解決ARM體系結構上的“ Maven無法解決依賴關系”?

[英]How to solve 'Maven cannot resolve dependencies' on ARM architecture?

我的Java項目在古典體系結構(即馮·諾依曼體系結構)上正常工作。 但是,maven無法解決對我的Jetson AGX的依賴關系,即ARM體系結構。 在ARM體系結構上編譯項目時,我需要更改什么? Maven上是否有相應的軟件包? pom.xml: 出現以下錯誤: ...

是否可以從JCuda向定義為Union的GPU內存發送數據?

[英]Is it possible to send data to GPU memory which is defined as Union, from JCuda?

我在GPU端(cuda)中定義了這樣的新數據類型: 在Java中,我們擁有定義的並集中可用數組之一的數組。 通常,如果我們有一個int類型的數組,則可以在Java(JCuda)中執行以下操作: 但是,如果設備上的數組類型是我們的聯合,該怎么辦呢? (假設h_array仍然是i ...

線程“主”中的異常java.lang.NoClassDefFoundError:jcuda / driver / JCudaDriver

[英]Exception in thread “main” java.lang.NoClassDefFoundError: jcuda/driver/JCudaDriver

我正在嘗試設置JCuda並執行示例附加內核。 當我嘗試在編譯JCudaVectorAdd.java之后執行JCudaVectorAdd時,出現以下錯誤: 我已經按照執行的步驟創建了一個bash文件,以到達我所在的位置: 盡管我對java或cuda / jcuda不夠熟悉,無法識 ...

如何在NetBeans中編譯和運行JCUDA?

[英]How to compile and run JCUDA in netbeans?

我想在Ubuntu 16.04上的IDE(Netbeans)中編譯並運行我的jcuda代碼。 我已經安裝了Netbeans,Maven,java和cuda 8.0。 例如,我想運行vector add的示例,其java文件是JCudaVectorAdd.java ,而cuda內核是JCu ...

嘗試運行JCuda示例時java.library.path中沒有JCudaRuntime-0.9.2-windows-x86_64

[英]No JCudaRuntime-0.9.2-windows-x86_64 in java.library.path when trying to run JCuda sample

我已經在Gradle中導入了以下庫: 並從JCuda頁面復制粘貼的JCublasSampleexample 。 不幸的是,我收到以下錯誤: 當然,圖書館是不存在的。 問題是如何將其鏈接到Maven / Gradle? 網站說所有DLL應該在JAR內。 CUDA已安 ...

如果NVIDIA控制面板設置了計算優化,則cuCtxCreate將失敗

[英]cuCtxCreate fails if NVIDIA control panel sets optimization for computing

我通過JCuda API運行CUDA。 當我使用NVIDIA控制面板為參與的JVM可執行文件(java.exe)設置計算優化(默認情況下處於關閉狀態)時,該程序無法在對cuCtxCreate的調用中創建上下文。 為了優化,程序運行正常。 唯一的問題是每次運行時內核中的經過時間偏差過大( ...

使用驅動程序API創建紋理對象時發生JCuda訪問沖突

[英]JCuda access violation when creating a texture object with the driver API

我有一個JCuda項目,它在嘗試使用驅動程序API創建紋理對象時遇到訪問沖突。 Java HotSpot聲稱該錯誤來自nvcuda.dll。 從中創建紋理的基礎CUarray似乎已正確填充。 將其內容復制回主機端float數組將導致該數組與初始主機端數據相同。 這意味着錯誤本身必須是 ...

如何為 CUDA 驅動程序 API 庫實現句柄?

[英]How to implement handles for a CUDA driver API library?

注意:問題已更新以解決評論中提出的問題,並強調問題的核心是關於 Runtime- 和 Driver API 之間的相互依賴關系 CUDA 運行時庫(如 CUBLAS 或 CUFFT)通常使用“句柄”的概念來概括此類庫的狀態和上下文。 使用模式非常簡單: 然而,關於這些句柄如何與驅動程序和運行時 ...

將cudaStream_t對象轉換為CUStream對象

[英]Convert cudaStream_t object to CUStream object

有沒有辦法將cudaStream_t對象轉換為CUStream ? 我發現這個黑客,但我認為它不安全。 或者,有沒有辦法只在CUDA 7.5中使用cudaStream_t對象在JCuda應用程序中調用cudaLaunchKernel ? ...

2017-08-28 06:15:22   1   302    cuda / jcuda  
您如何在jcuda中獲得CUDA內核數?

[英]How do you get CUDA cores count in jcuda?

如何獲得jcuda中的CUDA內核數? 我已經嘗試過了,但是沒有產生正確的輸出: 它返回16,但是我有1個Nvidia GPU和640個cudacore。 以上屬性的JavaDoc在此處可用 。 任何幫助將不勝感激。 ...

如何在不使用nvprof的情況下獲取CUDA事件的開始和結束時間

[英]How to get CUDA event starting and ending time without using nvprof

我編寫了一些Java代碼,這些代碼使用JCuda執行一些CUDA內核。 我想對應用程序進行概要分析,以了解流是如何重疊的以及諸如此類。 我能夠使用諸如cudaEventElpasedTime之類的cuda事件調用來獲取內核的執行時間,但是我不知道如何獲取同一內核的開始和結束時間戳記。 ...

在GTX1080上僅使用約2.2GB內存后,CUDA內存不足消息

[英]CUDA out of memory message after using just ~2.2GB of memory on a GTX1080

我正在使用JCuda,版本0.8.0RC和CUDA 8.0在GTX1080 GPU上進行矩陣乘法。 我以行優先矢量形式將兩個矩陣A和B裝入設備,並從設備讀取乘積矩陣。 但是我發現我的設備內存用完了比預期的要早。 例如,如果矩陣A的尺寸為100000 * 5000 = 5億個條目=價值2GB ...

JCuda的JCublas2.cublasSdot:無法將設備指針用作結果Pointer參數

[英]JCuda's JCublas2.cublasSdot: failed to use a device Pointer for the result Pointer parameter

在源代碼的JCublas2.cublasSdot注釋中,注釋了“結果”參數可以是“主機或設備指針”。 但是,我只能使用帶float [] fs = {0}的Pointer.to(fs)之類的主機指針。 如果我使用設備指針,例如'CUdeviceptr devicePtr = new C ...

2016-11-07 09:17:52   1   74    jcuda  
訪問CUDA內核中的變量時,CUDA_ERROR_ILLEGAL_ADDRESS

[英]CUDA_ERROR_ILLEGAL_ADDRESS when accessing variables in CUDA kernel

嘗試運行用於計算Buddhabrot分形軌道的內核時,出現CUDA_ERROR_ILLEGAL_ADDRESS異常。 我現在已經嘗試了多種方法,並且該錯誤似乎並非源於與我最初想到的相反的數組。 例如, 會很好。 但是,當我嘗試調試idx (請記住我首先以為該錯誤與數組有關), ...

在Hadoop-2.6.0中,容器因虛擬內存不足而被殺死

[英]In Hadoop-2.6.0, container was killed for not enough virtual memory

我正在嘗試在hadoop上實現jcuda代碼,並且它在本地模式下工作,但是當我在hadoop集群上運行作業時,它給了我一個錯誤:這里的容器被殺死是特定的錯誤報告: 16/04/29 10:18:07 INFO mapreduce。任務:任務ID:try_1461835313661_0014 ...

無法理解jCuda cuLaunchKernel如何工作?

[英]Cannot understand how jCuda cuLaunchKernel work?

我試圖了解如何在Java中使用Cuda。 我正在使用jCuda。 一切都很好,直到我遇到一個包含代碼的示例: 內核函數原型是: 問題是:就c而言,我們似乎沒有傳遞類似的東西嗎? 所以基本上,我們總是必須: 謝謝 ...

2015-12-21 03:51:23   1   501    jcuda  

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM