成功加入购物车

去购物车结算 X
书香无界北京外文书店
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)
  • 现货 Reinforcement Learning and Optimal Control  英文原版 强化学习与最优控制  德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)

现货 Reinforcement Learning and Optimal Control 英文原版 强化学习与最优控制 德梅萃·P. 博赛卡斯(Dimitri P. Bertsekas)

举报
  • 作者: 
  • 出版社:    Athena Scientific
  • ISBN:    9781886529397
  • 出版时间: 
  • 装帧:    精装
  • 页数:    388页
  • 作者: 
  • 出版社:  Athena Scientific
  • ISBN:  9781886529397
  • 出版时间: 
  • 装帧:  精装
  • 页数:  388页

售价 699.00

品相 全新品相描述

优惠 满包邮

优惠 满减券
    运费
    本店暂时无法向该地区发货

    延迟发货说明

    时间:
    说明:

    上书时间2021-03-06

    数量
    仅1件在售,欲购从速
    微信扫描下方二维码
    微信扫描打开成功后,点击右上角”...“进行转发

    卖家超过10天未登录

    • 商品详情
    • 店铺评价
    手机购买
    微信扫码访问
    • 商品分类:
      语言文字
      货号:
      GS236-2
      品相描述:全新
      新书,邮寄过程中封面边角轻微磕碰,图片实拍。
      商品描述:
      This book considers large and challenging multistage decision problems, which can be solved in principle by dynamic programming, but their exact solution is computationally intractable. We discuss solution methods that rely on approximations to produce suboptimal policies with adequate performance. These methods are known by several essentially equivalent names: reinforcement learning, approximate dynamic programming, and neuro-dynamic programming. They underlie, among others, the recent impressive successes of self-learning in the context of games such as chess and Go. One of the aims of the book is to explore the common boundary between artificial intelligence and optimal control, and to form a bridge that is accessible by workers with background in either field. Another aim is to organize coherently the broad mosaic of methods that have proved successful in practice while having a solid theoretical and/or logical foundation. This may help researchers and practitioners to find their way through the maze of competing ideas that constitute the current state of the art. The mathematical style of this book is somewhat different than other books by the same author. While we provide a rigorous, albeit short, mathematical account of the theory of finite and infinite horizon dynamic programming, and some fundamental approximation methods, we rely more on intuitive explanations and less on proof-based insights. We also illustrate the methodology with many example algorithms and applications. Selected sections, instructional videos and slides, and other supporting material may be found at the author's website.

      配送说明

      ...

      相似商品

      为你推荐

    孔网啦啦啦啦啦纺织女工火锅店第三课

    开播时间:09月02日 10:30

    即将开播,去预约
    直播中,去观看