代码之家  ›  专栏  ›  技术社区  ›  zimmerrol

Sarsa结合神经网络求解山地车任务

  •  2
  • zimmerrol  · 技术社区  · 7 年前

    Mountain Car Task q neural network this 密码但遗憾的是,我的经纪人并没有真正学会解决这项任务。在某些情况下,可以很快找到解决方案(100-200步),但有时代理需要超过30k步。我认为,我在实现中犯了一些基本错误,但我自己找不到。有人能帮我,并指出我实施中的错误/错误吗?

    1 回复  |  直到 7 年前
        1
  •  1
  •   zimmerrol    7 年前

    我通过改变网络结构来解决这个问题:而不是使用 (state, action) Q-value 当然,我改变了 DQN 它:我预测 value