簡體   English   中英

Tensorflow 1.12與CUDA 10.1兼容嗎?

[英]Is Tensorflow 1.12 compatible with CUDA 10.1?

我已經能夠成功建立一個帶有nvidia-smi 418.39,驅動程序版本418.39和CUDA 10.1的Ubuntu 18.04服務器

我現在有一個用戶想要運行TensorFlow,但堅持認為它與CUDA 10.1不兼容,只有CUDA 10.沒有任何聲明可以在任何我可以找到的在線確認,也不是TF的任何發布補丁說明。 因為設置這個系統是一件很痛苦的事情,所以我對嘗試降級一個版本有點猶豫不決。

有沒有人驗證TensorFlow 1.12是否與CUDA 10.1一起使用?

我可以確認即使tf 1.13.1也只適用於CUDA 10.0,而不是10.1。 不知道符號鏈接是否可以解決。 如果你試圖在CUDA 10.1上運行tf 1.13.1,它會給你“ImportError:libcublas.so.10.0:無法打開共享對象文件:沒有這樣的文件或目錄”

我還可以確認tf 1.13.1不適用於CUDA 10.1。 導入tensorflow時,您將收到以下錯誤

ImportError:libcublas.so.10.0:無法打開共享對象文件:沒有這樣的文件或目錄

運行ldconfig -v顯示了libcublas.so.10.0與libcublas.so.10.1.0.105的區別

TensorFlow 1.12(以至后來1.13.1和2.0.0版本alpha0) 不能對CUDA 10.1建成,因此可以被認為是不相容的。

我嘗試過使用GPU支持從源代碼構建TensorFlow。 我考慮的TensorFlow版本是1.13.12.0.0-alpha0 我使用的機器運行CentOS 7.6和GCC 4.8.5。 我安裝了NVIDIA驅動程序版本418.67 (發布日期為2019.5.7,支持CUDA Toolkit 10.1)。

我成功地用CUDA 10.0cuDNN 7.6.0 + NCCL 2.4.7構建了TensorFlow版本(對於CUDA 10.0)。 請注意,在構建具有GPU支持的TensorFlow時,您無需將GPU連接到計算機(特別是如果您在雲中使用VM)。

但是,當我切換到CUDA 10.1和cuDNN 7.6.0 + NCCL 2.4.7(對於CUDA 10.1)時,不能構建這些TensorFlow版本。 除了libcublas位置變化libcublas ,錯誤的另一個來源是沒有libcudart.so*cuda-10.1/lib64/ (雖然它們確實存在於cuda-10.0/lib64/ )。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM