代码之家  ›  专栏  ›  技术社区  ›  bluesummers

未找到nvidia smi可执行文件

  •  0
  • bluesummers  · 技术社区  · 7 年前

    在过去的几年里,我经历了3个不同的问题 nvidia-docker repo 关于这个确切的问题,但实际上无法找出问题所在。

    当我跑步时 nvidia-smi 不管是不是sudo,一切都很好,我得到了标准输出。 nvidia-docker run --rm nvidia/cuda nvidia-smi :

    nvidia docker插件| 2017/11/04 09:14:18收到卷“nvidia\u driver\u 387.22”的装载请求 块引用 nvidia docker插件| 2017/11/04 09:14:18收到卸载卷“nvidia\u driver\u 387.22”的请求

    我还试着运行 deepo 存储库,无法使其工作,因为我的所有容器都在启动时退出,并且 nvidia docker run--rm nvidia/cuda nvidia smi 输出错误:

    /usr/bin/docker-current:daemon的错误响应:oci运行时错误:container\u linux。go:247:启动容器进程导致“exec:\“nvidia smi\”:在$PATH中找不到可执行文件”。

    我做错了什么?

    如果有什么不同的话,我会用Fedora 26

    2 回复  |  直到 7 年前
        1
  •  0
  •   Gabriel Miretti aka gmiretti    7 年前

    在Ubuntu上,你应该安装 nvidia-modprobe 包裹我知道这也存在于Fedora中。出于某种原因,也没有记录这种依赖关系。

        2
  •  0
  •   bluesummers    7 年前

    我刚刚解决了这个问题。

    删除与相关的卷 nvidia-docker-plugin 解决了这个问题。

    对于未来的读者,只需在您的 nvidia docker插件 ,查找装载/卸载记录的行,并使用以下命令删除卷

    docker volume rm -f <volume_to_remove> 其中volume_to_remove应该类似于 nvidia_driver_387.22 (与我的情况相符)

    问题似乎是映射到 nvidia-smi 在创建卷时调用,移除并重新连接卷可以解决此问题