代码之家  ›  专栏  ›  技术社区  ›  thebeancounter

ubuntu创建tensorflow工作节点

  •  0
  • thebeancounter  · 技术社区  · 7 年前

    我在Ubuntu下使用tensorflow和python

    here

    我应该在独立机器上设置它,然后将它们全部绑定到集群吗? 我是否应该设置一个集群(如果是这样,请参考一些示例),然后将tf作为集群安装在集群上?

    谢谢

    1 回复  |  直到 7 年前
        1
  •  1
  •   dipendra009    7 年前

    我认为您错过了页面底部关于如何作为参数服务器或工作线程运行tensorflow的内容,这里有两个参数服务器和两个工作线程。job\u名称表示它是参数服务器还是工作者,task\u索引表示该组中机器的索引:

    # On ps0.example.com:
    $ python trainer.py \
         --ps_hosts=ps0.example.com:2222,ps1.example.com:2222 \
         --worker_hosts=worker0.example.com:2222,worker1.example.com:2222 \
         --job_name=ps --task_index=0
    # On ps1.example.com:
    $ python trainer.py \
         --ps_hosts=ps0.example.com:2222,ps1.example.com:2222 \
         --worker_hosts=worker0.example.com:2222,worker1.example.com:2222 \
         --job_name=ps --task_index=1
    # On worker0.example.com:
    $ python trainer.py \
         --ps_hosts=ps0.example.com:2222,ps1.example.com:2222 \
         --worker_hosts=worker0.example.com:2222,worker1.example.com:2222 \
         --job_name=worker --task_index=0
    # On worker1.example.com:
    $ python trainer.py \
         --ps_hosts=ps0.example.com:2222,ps1.example.com:2222 \
         --worker_hosts=worker0.example.com:2222,worker1.example.com:2222 \
         --job_name=worker --task_index=1