繁体   English   中英

Tensorflow / Nvidia / CUDA docker不匹配的版本

[英]Tensorflow/nvidia/cuda docker mismatched versions

我正在尝试将tensorflow和nvidia与docker结合使用,但遇到以下错误:

docker run --runtime = nvidia -it --rm tensorflow / tensorflow:latest-gpu python -c“将tensorflow导入为tf; tf.enable_eager_execution(); print(tf.reduce_sum(tf.random_normal([1000,1000]) ))”

泊坞窗:来自守护程序的错误响应:OCI运行时创建失败:container_linux.go:344:启动容器进程导致“ process_linux.go:424:容器初始化导致\\“ process_linux.go:407:运行prestart钩子1导致\\\\”错误运行挂钩:退出状态1,标准输出:,标准错误:exec命令:[/ usr / bin / nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig.real --device = all --compute --utility --require = cuda> = 10.0 brand = tesla,driver> = 384,driver <385 --pid = 5393 /var/lib/docker/overlay2/......./merged]\\\\nnvidia -container-cli:要求错误:不满意的情况:品牌= tesla \\\\ n \\\\“ \\”“:未知。

尝试运行nvidia-smi时出现类似错误:

docker运行--runtime = nvidia --rm nvidia / cuda nvidia-smi

但是,当尝试使用cuda:9.0-base运行nvidia-smi时,它的工作原理就像一个魅力:

docker运行--runtime = nvidia --rm nvidia / cuda:9.0-base nvidia-smi

我需要确保cuda 10正常工作还是可以使用cuda 9运行tensorflow? 我如何使用cuda:9.0-base运行tensorflow的docker镜像? (仍然是docker newby)。

非常感谢!

好的,我认为我终于开始弄清楚机器上的混乱情况。

tensorflow镜像并不关心cuda镜像的版本,它不使用docker cuda镜像。 它关心我的nvidia驱动程序,因为它在tensorflow图像中集成了CUDA。

(正在使用当前驱动程序的docker cuda映像是cuda:9.0)

这意味着我必须找到一个与我的驱动程序配合使用的tensorflow映像(390.116),或更新驱动程序。

我用tensorflow:1.12.0-gpu-py3尝试了相同的命令,它没有任何问题。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM