代码之家  ›  专栏  ›  技术社区  ›  Jenia Golbstein

对于多GPU机器,“rescale\u grad”的正确值是多少?

  •  0
  • Jenia Golbstein  · 技术社区  · 7 年前

    我的批量大小是512,我有8个GPU

    我应该定义: 重新缩放梯度 重新缩放梯度 = 1. / (8*512)

    谢谢

    1 回复  |  直到 7 年前
        1
  •  0
  •   Viacheslav V Kovalevskyi    7 年前

    批量大小与计算机有关,而与GPU无关。报价(来自 here ):

    工作负载分区

    默认情况下,MXNet在可用的 迭代每个GPU将在b/k示例上向前和向后执行。

    对你来说 b 是512。因此,您应该使用 rescale_grad = 1. / 512