[英]TensorFlow in nvidia-docker: failed call to cuInit: CUDA_ERROR_UNKNOWN
[英]Tensorflow/nvidia/cuda docker mismatched versions
我正在尝试将tensorflow和nvidia与docker结合使用,但遇到以下错误:
docker run --runtime = nvidia -it --rm tensorflow / tensorflow:latest-gpu python -c“将tensorflow导入为tf; tf.enable_eager_execution(); print(tf.reduce_sum(tf.random_normal([1000,1000]) ))”
泊坞窗:来自守护程序的错误响应:OCI运行时创建失败:container_linux.go:344:启动容器进程导致“ process_linux.go:424:容器初始化导致\\“ process_linux.go:407:运行prestart钩子1导致\\\\”错误运行挂钩:退出状态1,标准输出:,标准错误:exec命令:[/ usr / bin / nvidia-container-cli --load-kmods configure --ldconfig=@/sbin/ldconfig.real --device = all --compute --utility --require = cuda> = 10.0 brand = tesla,driver> = 384,driver <385 --pid = 5393 /var/lib/docker/overlay2/......./merged]\\\\nnvidia -container-cli:要求错误:不满意的情况:品牌= tesla \\\\ n \\\\“ \\”“:未知。
尝试运行nvidia-smi时出现类似错误:
docker运行--runtime = nvidia --rm nvidia / cuda nvidia-smi
但是,当尝试使用cuda:9.0-base运行nvidia-smi时,它的工作原理就像一个魅力:
docker运行--runtime = nvidia --rm nvidia / cuda:9.0-base nvidia-smi
我需要确保cuda 10正常工作还是可以使用cuda 9运行tensorflow? 我如何使用cuda:9.0-base运行tensorflow的docker镜像? (仍然是docker newby)。
非常感谢!
好的,我认为我终于开始弄清楚机器上的混乱情况。
tensorflow镜像并不关心cuda镜像的版本,它不使用docker cuda镜像。 它关心我的nvidia驱动程序,因为它在tensorflow图像中集成了CUDA。
(正在使用当前驱动程序的docker cuda映像是cuda:9.0)
这意味着我必须找到一个与我的驱动程序配合使用的tensorflow映像(390.116),或更新驱动程序。
我用tensorflow:1.12.0-gpu-py3尝试了相同的命令,它没有任何问题。
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.