繁体   English   中英

Tensorflow 2.3.x cudnn 失败 Windows 10 CUDA 10.1 CUDNN 7.6.5 Anaconda3

[英]Tensorflow 2.3.x cudnn failure Windows 10 CUDA 10.1 CUDNN 7.6.5 Anaconda3

运行 TensorFlow 2.3.x 然后停止然后再次运行它似乎导致 Tensorflow 无法初始化 cudnn。 在微调和调试前处理和后处理时,这种停止和启动是不可避免的。 每次 cudnn 失败时,我都必须重新启动计算机。 每次运行似乎有 50% 的概率发生这种失败。

我的设置是 Windows 10、CUDA 10.1 Update 2、CUDNN 7.6.5、Anaconda3 python 3.7/3.6、TensorFlow 2.3.0/2.3.1、NVIDIA RTX2080ti。 我遵循了https://www.tensorflow.org/install/gpu 上列出的确切要求,但这几乎无法使用。

我已经尝试过 python 3.7、python 3.6、cudnn 7.6.x 和 CUDA 10.1 original、update 1 和 update 2 以及 TensorFlow 2.2.0。 所有的结果都是一样的。 Tensorflow 打印输出显示所有 dll 都已成功加载,包括 cudnn64_7.dll。 为什么这么不稳定?

任何见解将不胜感激。

经过几天的调试,我发现问题不在于 CUDA、CUDNN、TensorFlow、Python、Anaconda,而实际上是 Windows 10。

为了让 Linux 虚拟机在 Windows 中运行,我错误地加入了 Windows Insider 计划。 那行得通,但随后 TensorFlow 在 Windows 中停止正常工作。 我读过内部程序有副作用,所以我重新安装了(这是在 10 天或更新后恢复到标准版本的唯一方法)。 我没有意识到 Windows 发布了一个主要版本更新 V2004 并认为我要回到我所拥有的。 因此,当我完成安装过程时,我下载了最新版本的 TF,并认为这是问题所在。

我启动了一台旧电脑并在上面运行我的代码。 然后我注意到 Windows 版本的差异并将我的旧电脑升级到 2004。一切仍然有效。 然后我找到了 1909 的 ISO 并将其安装在我的主计算机上,一切又开始工作了。

总之,看起来好像 Windows 10 V2004 不允许这些工具正确安装,但只要您不必重新安装任何东西,从 V1909 升级到 V2004 仍然可以工作。 谁知道当 TF 支持 CUDA 11 时会发生什么。Windows 10 V2004 用户可能不得不坚持使用旧版本的 TF。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM