繁体   English   中英

使用Cuda Toolkit 7.5和cuDNN 7.0的Tensorflow 0.7.1

[英]Tensorflow 0.7.1 with Cuda Toolkit 7.5 and cuDNN 7.0

我最近尝试将我的Tensorflow安装从0.6升级到0.7.1(Ubuntu 15.10,Python 2.7),因为它被描述为与更新的Cuda库兼容。 一切都运行良好,包括Tensorflow入门页面的简单测试。 但是我无法使用cuDNN。 使用cuDNN运行程序时,我首先收到警告

“无法加载cuDNN DSO”

后来程序崩溃了

I tensorflow/core/common_runtime/gpu/gpu_device.cc:717] Creating TensorFlow device (/gpu:0) -> (device: 0, name: GeForce GTX 980, pci bus id: 0000:01:00.0)
I tensorflow/core/common_runtime/gpu/gpu_bfc_allocator.cc:73] Allocating 3.30GiB bytes.
I tensorflow/core/common_runtime/gpu/gpu_bfc_allocator.cc:83] GPU 0 memory begins at 0x704a80000 extends to 0x7d80c8000
F tensorflow/stream_executor/cuda/cuda_dnn.cc:204] could not find cudnnCreate in cudnn DSO; dlerror: /usr/local/lib/python2.7/dist-packages/tensorflow/python/_pywrap_tensorflow.so: undefined symbol: cudnnCreate

我为Cuda安装下载的文件是

  • cuda-repo-ubuntu1504-7-5-local_7.5-18_amd64.deb和
  • cudnn-7.0的Linux-x64的V4.0-prod.tgz

我按照Tensorflow入门页面上的说明进行操作,但使用cuDNN 7.0而不是6.5。 $ LD_LIBRARY_PATH是“/ usr / local / cuda / lib64”

我不知道为什么找不到cudnnCreate。 是否有人成功安装了此配置并可以给我建议?

当我忘记设置LD_LIBRARY_PATHCUDA_HOME环境变量时,我得到了同样的错误:

export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda/lib64" export CUDA_HOME=/usr/local/cuda

我按照此说明在archlinux中安装TensorFlow: https//github.com/ddigiorg/AI-TensorFlow/blob/master/install/install-TF_2016-02-27.md

您似乎需要cuDNN v2或更高版本,您可以通过注册加速计算开发人员计划获得,通常需要2天时间: https//developer.nvidia.com/accelerated-computing-developer

更新 :看来你已经有了cuDNNv2

jorgemf发送的链接(谢谢)描述了Python 3.5的安装,我差点切换到Python 3.5。 我对目前安装的最后一次尝试是再次将cuDNN库复制到/ usr / local / cuda / lib64。

它奏效了! 所以问题解决了,虽然我仍然不知道为什么会这样。

Ubuntu 14.04 && cudnnV5.0 && Cuda7.5

我得到了一些错误并以另一种方式解决了它。 按照官方的入门页面,我使用下面的命令安装cudnn,这基本上只是将这些文件复制到我们的cuda目录中

https://www.tensorflow.org/versions/r0.10/get_started/os_setup.html#optional-install-cuda-gpus-on-linux

tar xvzf cudnn-7.5-linux-x64-v5.1-ga.tgz

sudo cp cuda / include / cudnn.h / usr / local / cuda / include

sudo cp cuda / lib64 / libcudnn * / usr / local / cuda / lib64

sudo chmod a + r /usr/local/cuda/include/cudnn.h / usr / local / cuda / lib64 / libcudnn *

但是这样做之后,如果我们使用ll命令显示“/ usr / local / cuda / lib64”中的所有文件并与源文件进行比较

这些软链接似乎在复制后已经破碎。 所以我删除它们并手动创建,如下所示:

sudo rm libcudnn.so.5 libcudnn.so

sudo ln -sf libcudnn.so.5 libcudnn.so

sudo ln -sf libcudnn.so.5.1.3 libcudnn.so.5

之后,执行

sudo ldconfig / usr / local / cuda / lib64

它终于奏效了!

Windows 10用户的错误解决方案:

  • cuda站点下载适用于Windows 10的cuDNN v5.1库,必要时进行注册。

  • 将该zip存档中的cudnn64_5.dll (cuda \\ bin \\ cudnn64_5.dll) 复制

C:\\ Program Files \\ NVIDIA GPU Computing Toolkit \\ CUDA \\ v8.0 \\ bin \\;

如果C:\\ Program Files \\ NVIDIA GPU Computing Toolkit \\ CUDA \\ v8.0是CUDA工具包的安装路径。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM