1
3
如果你有两个GPU,我会使用数据并行。在数据并行中,每个GPU上都有一个模型副本,每个副本都有一个批处理。然后收集渐变并用于更新副本。
|
Ze0ruso · 做模型。eval()在代码中的位置有什么关系? 2 年前 |
Palkin Jangra · 如何迭代一列以获得每行的平均值? 2 年前 |
Ofek Nourian · 完全连通的简单自回归模型预测 2 年前 |
chao · 如何提取和存储自动语音识别深度学习应用程序生成的文本 2 年前 |
Jack Arnestad · 使用预训练单词嵌入对单词“池”进行分类 6 年前 |