[英]Cuda 10.1. cuDNN 7.6.6 are compatible with tensorflow 1.14?
[英]Is Tensorflow 1.12 compatible with CUDA 10.1?
我已經能夠成功建立一個帶有nvidia-smi 418.39,驅動程序版本418.39和CUDA 10.1的Ubuntu 18.04服務器
我現在有一個用戶想要運行TensorFlow,但堅持認為它與CUDA 10.1不兼容,只有CUDA 10.沒有任何聲明可以在任何我可以找到的在線確認,也不是TF的任何發布補丁說明。 因為設置這個系統是一件很痛苦的事情,所以我對嘗試降級一個版本有點猶豫不決。
有沒有人驗證TensorFlow 1.12是否與CUDA 10.1一起使用?
我可以確認即使tf 1.13.1也只適用於CUDA 10.0,而不是10.1。 不知道符號鏈接是否可以解決。 如果你試圖在CUDA 10.1上運行tf 1.13.1,它會給你“ImportError:libcublas.so.10.0:無法打開共享對象文件:沒有這樣的文件或目錄”
我還可以確認tf 1.13.1不適用於CUDA 10.1。 導入tensorflow時,您將收到以下錯誤
ImportError:libcublas.so.10.0:無法打開共享對象文件:沒有這樣的文件或目錄
運行ldconfig -v顯示了libcublas.so.10.0與libcublas.so.10.1.0.105的區別
TensorFlow 1.12(以至后來1.13.1和2.0.0版本alpha0) 不能對CUDA 10.1建成,因此可以被認為是不相容的。
我嘗試過使用GPU支持從源代碼構建TensorFlow。 我考慮的TensorFlow版本是1.13.1和2.0.0-alpha0 。 我使用的機器運行CentOS 7.6和GCC 4.8.5。 我安裝了NVIDIA驅動程序版本418.67 (發布日期為2019.5.7,支持CUDA Toolkit 10.1)。
我成功地用CUDA 10.0和cuDNN 7.6.0 + NCCL 2.4.7構建了TensorFlow版本(對於CUDA 10.0)。 請注意,在構建具有GPU支持的TensorFlow時,您無需將GPU連接到計算機(特別是如果您在雲中使用VM)。
但是,當我切換到CUDA 10.1和cuDNN 7.6.0 + NCCL 2.4.7(對於CUDA 10.1)時,不能構建這些TensorFlow版本。 除了libcublas
位置變化libcublas
,錯誤的另一個來源是沒有libcudart.so*
在cuda-10.1/lib64/
(雖然它們確實存在於cuda-10.0/lib64/
)。
聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.