动态规划与优控制——近似动态规划(第2卷) 大中专理科计算机 (美)徳梅萃·p.博塞克斯新华正版

本书系统介绍动态规划，特别是近似动态规划，包括折扣问题的理论与计算方、很短路问题、无折扣问题、均费用问题、折扣与无折扣问题的近似动态规划等。

作者: (美)徳梅萃·p.博塞克斯
出版社: 清华大学出版社
ISBN: 9787302561460
出版时间: 2021-02
版次: 1

装帧: 平装
开本: 16开
页数: 504页
字数: 841千字

作者: (美)徳梅萃·p.博塞克斯
出版社: 清华大学出版社
ISBN: 9787302561460

出版时间: 2021-02
版次: 1
装帧: 平装

开本: 16开
页数: 504页
字数: 841千字

售价 92.95 7.2折

定价￥129.00

品相全新品相描述

优惠

运费

本店暂时无法向该地区发货

延迟发货说明

时间：

说明：

上书时间2023-12-27

数量: 库存18件

立即购买加入购物车收藏

卖家超过10天未登录

商品详情
店铺评价

手机购买

微信扫码访问

商品分类：

计算机与互联网

货号：

xhwx_1202318152

品相描述：全新

正版特价新书

商品描述：

主编：

本书系统介绍动态规划，特别是近似动态规划，包括折扣问题的理论与计算方、短路问题、无折扣问题、均费用问题、折扣与无折扣问题的近似动态规划等。

目录：

章  折扣问题——理论1

1.1  费用小化——介绍1

1.1.1  有限阶段动态规划算3

1.1.2  符号简写与单调4

1.1.3  无穷阶段结果的预览6

1.1.4  的和依赖历史的策略7

1.2  折扣问题——各阶段费用有界9

1.3  调度与多柄老虎机问题15

1.3.1  项目的指标16

1.3.2  项目逐个退出策略17

1.4  折扣连续时间问题23

1.5  压缩映的作用32

1.5.1  极大模压缩33

1.5.2  折扣问题——单阶段费用无界38

1.6  折扣动态规划的一般形式40

1.6.1  压缩与单调的基本结论44

1.6.2  折扣动态博弈49

1.7  注释、参文献及题50

题51

第2章  折扣问题——计算方57

2.1  马尔可夫决策问题57

2.2  值迭代59

2.2.1  值迭代的单调误差界59

2.2.2  值迭代的变形65

2.2.3  q-学67

2.3  策略迭代69

2.3.1  针对费用的策略迭代69

2.3.2  q-因子的策略迭代72

2.3.3  乐观策略迭代73

2.3.4  有限前瞻策略和滚动75

2.4  线规划方79

2.5  一般折扣问题的方81

2.5.1  采用近似的有限前瞻策略83

2.5.2  推广的值迭代85

2.5.3  近似值迭代86

2.5.4  推广的策略迭代87

2.5.5  推广的乐观策略迭代90

2.5.6  近似策略迭代94

2.5.7  数学规划97

2.6  异步方98

2.6.1  异步值迭代98

2.6.2  异步策略迭代102

2.6.3  具有均一不动点的策略迭代105

2.7  注释、资源和题110

题112

第3章  短路问题122

3.1  问题建模122

3.2  主要结论124

3.3  基本压缩质130

3.4  值迭代131

3.4.1  有限步终止的条件131

3.4.2  异步值迭代133

3.5  策略迭代134

3.5.1  乐观策略迭代135

3.5.2  近似策略迭代136

3.5.3  具有不合适策略的策略迭代137

3.5.4  具有均一不动点的异步策略迭代140

3.6  可数状态问题143

3.7  注释、资源和题145

题146

第4章  无折扣问题151

4.1  每阶段的费用无界151

4.1.1  主要结论152

4.1.2  值迭代158

4.1.3  其他计算方163

4.2  线系统和二次费用163

4.3  库存控制165

4.4  很优停止167

4.5  很优博弈策略171

4.6  连续时间问题——排队的控制177

4.7  非稳和周期问题183

4.8  注释、资源和题187

题188

第5章  每阶段均费用问题196

5.1  有限空间均费用模型196

5.1.1  与折扣费用问题的关系198

5.1.2  blackwell 很优策略203

5.1.3  很优条件210

5.2  所有初始状态的均费用相等的条件213

5.3  值迭代217

5.3.1  单链值迭代219

5.3.2  多链值迭代231

5.4  策略迭代236

5.4.1  单链策略迭代236

5.4.2  多链策略迭代240

5.5  线规划244

5.6  无穷空间均费用模型248

5.6.1  很优的充分条件254

5.6.2  有限状态空间和无限控制空间255

5.6.3  可数状态——消失的折扣方262

5.6.4  可数状态——压缩方264

5.6.5  具有二次费用的线系统267

5.7  注释、资源和题268

题270

第6章  近似动态规划：折扣模型279

6.1  基于的费用近似的一般问题280

6.1.1  近似结构280

6.1.2  基于的近似策略迭代284

6.1.3  直接和间接近似288

6.1.4  蒙特卡罗289

6.1.5  简化295

6.2  直接策略评价——梯度298

6.3  策略评价的投影方程方302

6.3.1  投影贝尔曼方程303

6.3.2  投影方程的矩阵形式305

6.3.3  基于的估计方308

6.3.4  lstd、lspe 和td(0) 方310

6.3.5  乐观版本312

6.3.6  多步基于的方313

6.3.7  提要320

6.4  策略迭代问题322

6.4.1  基于几何采样的搜索增强324

6.4.2  基于离线策略方的搜索增强332

6.4.3  策略振荡——震颤334

6.5  聚集方339

6.5.1  基于聚集问题的费用近似344

6.5.2  通过增广问题的费用近似346

6.5.3  多步聚集350

6.5.4  异步分布聚集351

6.6  q-学353

6.6.1  q-学：值迭代算353

6.6.2  q-学和策略迭代355

6.6.3  q-因子近似和投影方程356

6.6.4  很优停止问题的q-学358

6.6.5  q-学和聚集362

6.6.6  有限阶段q-学364

6.7  注释、资源和题365

题370

第7章  近似动态规划：无折扣模型及推广380

7.1  短路问题380

7.2  均费用问题384

7.2.1  近似策略评价384

7.2.2  近似策略迭代391

7.2.3  均费用问题的q-学392

7.3  一般问题和蒙特卡罗线代数395

7.3.1  投影方程401

7.3.2  矩阵逆合迭代方406

7.3.3  多步方412

7.3.4  很优停止的q-学的推广418

7.3.5  方程误差方420

7.3.6  倾斜投影424

7.3.7  推广聚集426

7.3.8  奇异线系统的确定方428

7.3.9  奇异线系统的方436

7.4  在策略空间的近似445

7.4.1  梯度公式445

7.4.2  通过计算梯度446

7.4.3  梯度评价的关键特征448

7.4.4  策略和值空间的近似450

7.5  注释、资源和题450

题453

附录a  动态规划中的测度论问题460

a.1  两阶段例子460

a.2  可测问题的解决方463

参文献470

??

??

??

内容简介：

本书系统介绍动态规划，特别是近似动态规划，包括折扣问题的理论与计算方、短路问题、无折扣问题、均费用问题、折扣与无折扣问题的近似动态规划等。
配送说明

...
相似商品
为你推荐

孔网分类

图书

图书

动态规划与优控制——近似动态规划(第2卷) 大中专理科计算机 (美)徳梅萃·p.博塞克斯 新华正版

孔网啦啦啦啦啦纺织女工火锅店第三课

动态规划与优控制——近似动态规划(第2卷) 大中专理科计算机 (美)徳梅萃·p.博塞克斯新华正版