簡體   English   中英

Tensorflow 2.3.x cudnn 失敗 Windows 10 CUDA 10.1 CUDNN 7.6.5 Anaconda3

[英]Tensorflow 2.3.x cudnn failure Windows 10 CUDA 10.1 CUDNN 7.6.5 Anaconda3

運行 TensorFlow 2.3.x 然后停止然后再次運行它似乎導致 Tensorflow 無法初始化 cudnn。 在微調和調試前處理和后處理時,這種停止和啟動是不可避免的。 每次 cudnn 失敗時,我都必須重新啟動計算機。 每次運行似乎有 50% 的概率發生這種失敗。

我的設置是 Windows 10、CUDA 10.1 Update 2、CUDNN 7.6.5、Anaconda3 python 3.7/3.6、TensorFlow 2.3.0/2.3.1、NVIDIA RTX2080ti。 我遵循了https://www.tensorflow.org/install/gpu 上列出的確切要求,但這幾乎無法使用。

我已經嘗試過 python 3.7、python 3.6、cudnn 7.6.x 和 CUDA 10.1 original、update 1 和 update 2 以及 TensorFlow 2.2.0。 所有的結果都是一樣的。 Tensorflow 打印輸出顯示所有 dll 都已成功加載,包括 cudnn64_7.dll。 為什么這么不穩定?

任何見解將不勝感激。

經過幾天的調試,我發現問題不在於 CUDA、CUDNN、TensorFlow、Python、Anaconda,而實際上是 Windows 10。

為了讓 Linux 虛擬機在 Windows 中運行,我錯誤地加入了 Windows Insider 計划。 那行得通,但隨后 TensorFlow 在 Windows 中停止正常工作。 我讀過內部程序有副作用,所以我重新安裝了(這是在 10 天或更新后恢復到標准版本的唯一方法)。 我沒有意識到 Windows 發布了一個主要版本更新 V2004 並認為我要回到我所擁有的。 因此,當我完成安裝過程時,我下載了最新版本的 TF,並認為這是問題所在。

我啟動了一台舊電腦並在上面運行我的代碼。 然后我注意到 Windows 版本的差異並將我的舊電腦升級到 2004。一切仍然有效。 然后我找到了 1909 的 ISO 並將其安裝在我的主計算機上,一切又開始工作了。

總之,看起來好像 Windows 10 V2004 不允許這些工具正確安裝,但只要您不必重新安裝任何東西,從 V1909 升級到 V2004 仍然可以工作。 誰知道當 TF 支持 CUDA 11 時會發生什么。Windows 10 V2004 用戶可能不得不堅持使用舊版本的 TF。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM