代码之家 › 专栏 › 技术社区 › yoki

tensorflow如何有效地计算从输入到损耗的梯度?

tensorflow

yoki · 技术社区 · 6 年前

计算输出层尺寸的导数 N W.R.T尺寸输入 M ,我们需要一个雅可比矩阵 M x N 是的。为了使用链式规则计算从损失到输入的完整梯度,我们需要在内存中存储大量这样的雅可比矩阵。

我假设tensorflow并不是为图的每一步计算一个完整的jacobian矩阵,而是做一些更有效的事情。它是怎么做到的?

谢谢

1 回复 | 直到 6 年前

rvinas 5 年前

tensorflow使用自动微分来有效地计算梯度。具体地说,它定义了一个计算图,其中节点是操作,每个有向边表示子节点相对于其父节点的偏导数。运算的全导数 F型关于十然后由所有路径值的和给出十到 F型 ,其中每个路径值是边上操作的偏导数的乘积。

更具体地说,tensorflow使用反向微分,它包括一个向前的过程来计算计算图中每个节点的值,一个向后的过程来计算函数的偏导数。 F型我们正在对图中的每个节点进行区分。我们需要对函数的每个维度重复反向过程 F型因此计算复杂度为O( 尺寸(F) )*O型( F型 ),其中 尺寸(F) 是函数的输出维数 F型是的。

尽管这种方法是内存密集型的(它需要在运行反向传递之前存储所有节点的值),但它对于机器学习非常有效,在机器学习中我们通常有一个标量函数 F型 (即 尺寸(f)=1 )

你可能会发现 this 资源有用。

推荐文章

albert · AttributeError:“str”对象没有属性“str”如何解决此问题

2 年前

Anshuman Sinha · 将tensforflow中的所有nan值转换为零

2 年前

CoccoSyn · Keras TypeError:其中一个输入没有可接受的类型。具有参差不齐张量的LSTM

2 年前

rob me of my freedom · 在不使用Y_pred和Y_actual的tensorflow中编写自定义损失

2 年前

Chris · 如何捕获导入脚本功能的打印

2 年前

Jay Bhie Santos · 剩余GRU:ValueError:输入具有不兼容的形状。收到的形状(5)和(24)

2 年前

Danijel · C中TensorFlow模型文件的路径?

2 年前

Joseph · 重塑BatchDataset训练模型的输入-Tensorflow

2 年前

Arya Anish · tensorflow安装中面临的问题

2 年前

so beautiful memory · 如何将我在本地训练的tensorflow模型正确部署到谷歌云人工智能平台?我部署了它,但没有图像返回

2 年前