动态规划与最优控制——近似动态规划(第2卷)
举报
正版新书 新华官方库房直发 可开电子发票
-
作者:
(美)徳梅萃·P.博塞克斯
-
出版社:
清华大学出版社
-
ISBN:
9787302561460
-
出版时间:
2021-02
-
版次:
1
-
装帧:
平装
-
开本:
16开
-
纸张:
胶版纸
-
页数:
504页
-
字数:
841千字
-
作者:
(美)徳梅萃·P.博塞克斯
-
出版社:
清华大学出版社
-
ISBN:
9787302561460
-
出版时间:
2021-02
-
纸张:
胶版纸
-
页数:
504页
-
字数:
841千字
售价
¥
99.33
7.7折
定价
¥129.00
品相
全新品相描述
上书时间2024-05-08
卖家超过10天未登录
手机购买
微信扫码访问
-
-
商品描述:
-
主编推荐:
本书系统性介绍动态规划,特别是近似动态规划,包括折扣问题的理论与计算方法、随机最短路问题、无折扣问题、平均费用问题、折扣与无折扣问题的近似动态规划等。
内容简介:
本书系统性介绍动态规划,特别是近似动态规划,包括折扣问题的理论与计算方法、随机最短路问题、无折扣问题、平均费用问题、折扣与无折扣问题的近似动态规划等。
目录:
第1章 折扣问题——理论1
1.1 总费用最小化——介绍1
1.1.1 有限阶段动态规划算法3
1.1.2 符号简写与单调性4
1.1.3 无穷阶段结果的预览6
1.1.4 随机的和依赖历史的策略7
1.2 折扣问题——各阶段费用有界9
1.3 调度与多柄老虎机问题15
1.3.1 项目的指标16
1.3.2 项目逐个退出策略17
1.4 折扣连续时间问题23
1.5 压缩映射的作用32
1.5.1 极大模压缩33
1.5.2 折扣问题——单阶段费用无界38
1.6 折扣动态规划的一般形式40
1.6.1 压缩与单调性的基本结论44
1.6.2 折扣动态博弈49
1.7 注释、参考文献及习题50
习题51
第2章 折扣问题——计算方法57
2.1 马尔可夫决策问题57
2.2 值迭代59
2.2.1 值迭代的单调误差界59
2.2.2 值迭代的变形65
2.2.3 Q-学习67
2.3 策略迭代69
2.3.1 针对费用的策略迭代69
2.3.2 Q-因子的策略迭代72
2.3.3 乐观策略迭代73
2.3.4 有限前瞻策略和滚动75
2.4 线性规划方法79
2.5 一般折扣问题的方法81
2.5.1 采用近似的有限前瞻策略83
2.5.2 推广的值迭代
...
孔网啦啦啦啦啦纺织女工火锅店第三课
开播时间:09月02日 10:30
即将开播,去预约
直播中,去观看