成功加入购物车
图书条目标准图
正版预售 按需印刷
张智聪 、 郑力 著 / 科学出版社 / 2016-06 / 平装
售价 ¥ 88.00
品相 全新
优惠 满包邮
延迟发货说明
上书时间2024-04-03
卖家超过10天未登录
基于增强学习的制造系统调度
增强学习是人工智能领域一种应用越来越广泛的机器学习算法。《基于增强学习的制造系统调度》对增强学习的基本原理、主要经典算法及其在制造系统调度领域若干问题的应用进行阐述。主要内容包括:Sarsa(λ,k)增强学习算法等增强学习算法的介绍及相关理论证明;增强学习架构及面向生产调度问题的增强学习模型构建方式;流水车间调度问题、平行机调度问题、半导体测试调度问题等制造系统调度问题与自组织型排队网络调度问题的增强学习模型及解决方案;增强学习在以上调度问题应用的实验结果及相关分析等。
《基于增强学习的制造系统调度》适合管理科学与工程、工业工程等专业的研究生和本科生使用,也可供从事制造系统分析与优化、智能调度等领域工作的研究人员和工程技术人员参考。
张智聪,1980年生,广东东莞人,2007年于清华大学获博士学位,现任东莞理工学院教授、中国机械工程学会生产工程分会生产系统专业委员会常委。主要研究领域是制造系统优化、排队网络,增强学习。主持国家自然科学基金、教育部人文社会科学研究项目、广东省自然科学基金,广东省科技计划、广东省高等学校优秀青年教师培养计划、广东省教育厅重点平台及科研项目等多个科研项目。在国内外期刊发表论文20余篇,获得4项专利授权和1项软件著作权。
郑力,1991年于清华大学获博士学位,现任清华大学工业工程系教授、博士生导师、教育部长江学者特聘教授,机械工程学会工业工程分会副主任委员,生产工程分会的常务理事、国际工业工程学会中国部首任主任,多个国际学术期刊的编委。主要研究领域是生产系统分析与管理、企业信息化。发表论文200余篇,出版专著和教材5本,曾获得国家科技进步奖、高等教育国家教学成果一等奖、国家发明奖、教育部优秀青年教师奖和北京市五一劳动奖章,享受国务院特殊津贴。
前言第1章 绪论1.1 增强学习基本原理1.1.1 马尔可夫决策过程1.1.2 增强学习系统1.1.3 增强学习算法的分类与发展概述1.2 增强学习算法应用引例——最短路问题1.3 增强学习算法在调度领域的应用研究1.4 本书组织结构第2章 增强学习算法2.1 经典的增强学习算法2.1.1 TD/TD(λ)学习算法2.1.2 Q学习2.1.3 Sarsa算法2.1.4 R学习2.2 Sarsa(λ,k)算法2.2.1 Sarsa(λ,k)算法的基本原理2.2.2 前视与后视Sarsa(λ,k)算法2.2.3 Sarsa(λ,k)算法的性质2.3 SMDP型Sarsa(λ,k)算法2.4 多维行为的增强学习算法2.5 一种自适应步长的增强学习算法第3章 流水车间调度问题3.1 问题描述3.2 流水车间调度问题的增强学习模型3.2.1 系统状态表示3.2.2 行为3.2.3 报酬函数3.3 结合线性函数泛化器的TD(λ)算法及实验结果3.3.1 结合线性函数泛化器的TD(λ)算法3.3.2 实验结果第4章 平行机调度问题4.1 最小化加权平均流程时间的离线平行机调度4.1.1 问题描述4.1.2 增强学习模型4.1.3 实验结果4.2 最小化加权平均误工时间的离线平行机调度4.2.1 问题描述4.2.2 增强学习建模4.2.3 实验结果4.3 最小化加权平均流程时间的在线平行机调度4.3.1 问题描述4.3.2 增强学习模型4.3.3 实验结果4.4 最小化加权平均误工时间的在线平行机调度4.4.1 问题描述4.4.2 增强学习模型4.4.3 求解变速机调度问题的R学习4.4.4 实验结果第5章 半导体测试调度问题5.1 半导体测试调度问题描述5.2 关于半导体测试调度的研究5.2.1 附加资源充足的半导体测试调度5.2.2 附加资源受限的半导体测试调度5.2.3 和半导体测试调度相关的调度问题5.2.4 小结5.3 整数规划模型5.3.1 符号定义5.3.2 决策变量5.3.3 目标函数和约束5.3.4 问题性质分析5.4 半导体测试调度问题的增强学习模型5.4.1 状态变量及状态转移机制5.4.2 行为5.4.3 报酬函数5.5 结合函数泛化器的Sarsa(λ,k)算法5.5.1 径向基神经网络函数泛化器5.5.2 神经网络的构造5.5.3 函数泛化器的权重更新法则5.5.4 结合径向基神经网络函数泛化器的Sarsa(λ,k)算法5.6 演示算例5.7 参数设置与函数泛化器性能分析5.7.1 行为选择5.7.2 参数设置5.7.3 函数泛化器性能分析5.8 半导体测试调度实验结果与分析5.8.1 与工业方法及各行为策略对比5.8.2 与其他增强学习算法对比5.8.3 与能力约束调度方法对比5.9 讨论5.10 可重构制造系统调度5.10.1 具有可重构特性的调度系统机制5.10.2 增强学习模型架构第6章 排队网络控制问题6.1 多服务台排队系统控制的半马尔可夫决策模型6.1.1 问题描述6.1.2 半马尔可夫决策模型建模6.1.3 排队控制系统的性质6.1.4 数值例子6.2 自组织型排队网络控制问题6.2.1 自组织型排队网络控制问题描述6.2.2 自组织型排队网络控制问题的增强学习模型6.2.3 解决自组织型排队网络控制问题的增强学习算法第7章 结束语参考文献其他参考文献
展开全部
配送说明
...
相似商品
为你推荐
开播时间:09月02日 10:30