代码之家 › 专栏 › 技术社区 › Stepan Yakovenko

为什么PyTorch不为我最小化x*x?

tensor pytorch optimization python

Stepan Yakovenko · 技术社区 · 6 年前

我期望x收敛到0,这是x*x的最小值,但这不会发生。我在这个小示例代码中犯了什么错误:

import torch
from torch.autograd import Variable
tns = torch.FloatTensor([3])
x = Variable(tns, requires_grad=True)
z = x*x
opt = torch.optim.Adam([x], lr=.01, betas=(0.5, 0.999))
for i in range(3000):
    z.backward(retain_graph=True) # Calculate gradients
    opt.step()
    print(x)

1 回复 | 直到 6 年前

enumaris 6 年前

你的问题是,当你计算每个循环的时候,你不会把梯度调零。相反,通过设置 retain_graph=True 不打电话 opt.zero_grad() 在循环的每个步骤中,实际上都要添加计算得出的梯度所有以前计算的梯度。所以你不是在梯度下降中迈出一步,而是在 全部的 累积梯度,这当然不是你想要的。

你应该打电话给 零梯度选择 在循环开始时,移动 z=x*x 在你的循环里这样你就不必 retain_graph .

我做了一些细微的修改:

import torch
from torch.autograd import Variable
tns = torch.FloatTensor([3])
x = Variable(tns, requires_grad=True)
opt = torch.optim.Adam([x], lr=.01, betas=(0.5, 0.999))
for i in range(3000):
    opt.zero_grad()
    z = x*x
    z.backward() # Calculate gradients
    opt.step()
    print(x)

还有我的决赛 x 是 1e-25 .

推荐文章

Ze0ruso · 做模型。eval()在代码中的位置有什么关系?

2 年前

rkraaijveld · sklearn的Coef。线性回归为无

2 年前

Ellis Thompson · 填充一个numpym数组以满足所需的大小

2 年前

Adam · 如何在多个模型上并行运行PyTorch推理?

2 年前

quinlan · 是dgl。nn。皮托克。GraphConv聚合边缘信息?

2 年前

Ofek Nourian · 完全连通的简单自回归模型预测

2 年前

MrThiele1708 · 运行时错误:mat1和mat2形状不能相乘(5400x64和5400x64)

2 年前

Moodhi · 计算GEC的F分数

2 年前

john wang · matlab使用可调用的python函数,但需要输入

2 年前

odbhut.shei.chhele · 如何解决错误:RuntimeError:收到0项ancdata

2 年前