多智能体机器学习:强化学习方法
- 资料大王PDF
-
1 次阅读
-
1 次下载
-
2023-09-18 23:35:44
微信
赏
支付宝
文档简介:
多智能体机器学习:
强化学习方法
[加拿大] 霍华德 M. 施瓦兹 (Howard M. Schwartz)
著
连晓峰 谭励 等译
机 械 工 业 出 版 社
本书主要介绍了多智能体机器人强化学习的相关内容。 全书共 6
章, 首先介绍了几种常用的监督式学习方法, 在此基础上, 介绍了单
智能体强化学习中的学习结构、 值函数、 马尔科夫决策过程、 策略迭
代、 时间差分学习、 Q 学习和资格迹等概念和方法。 然后, 介绍了双
人矩阵博弈问题、 多人随机博弈学习问题, 并通过 3 种博弈游戏详细
介绍了纳什均衡、 学习算法、 学习自动机、 滞后锚算法等内容, 并提
出 LR - I滞后锚算法和指数移动平均 Q 学习算法等, 并进行了分析比
较。 接下来, 介绍了模糊系统和模糊学习, 并通过仿真示例详细分析
算法。 最后, 介绍了群智能学习进化以及性格特征概念和应用。 全书
内容丰富, 重点突出。
本书可作为从事机器学习、 多智能体协同控制等领域的工程技术
人员的参考书, 也可作为高等院校相关专业本科生、 研究生以及教师
的参考用书。
译
者
序
“多智能体” —
—
—一般专指多智能体系统 (Multi - Agent System, MAS) 或
多智能体技术 (Multi - Agent Technology, MAT)。 多智能体系统是分布式人工智
能的一个重要分支, 是 20 世纪末 ~ 21 世纪初国际上人工智能的前沿学科。 多智
能体学习相关的研究领域已成为人工智能发展的热点。
本书主要介绍了多智能体学习的相关内容, 目的在于解决大型、 复杂的现实
问题, 而解决这类问题已超出了单个智能体的能力。 研究者主要研究智能体之间
的交互通信、 协调合作、 冲突消解等方面, 强调多个智能体之间的紧密群体合
作, 而非个体能力的自治和发挥, 关于 Lyapunov 技术的非线性自适应控制方面
的理论材料被减少, 取而代之的是有关强化学习的思想。 强化学习的目标是取得
最大化的奖励 (回报)。 强化学习和非监督学习最有趣的部分就是奖励的选择,
这是一个全新的发展迅速的应用领域。 机器人团队必须要学会共同工作和相互竞
争。 本书是一本专门介绍多智能体强化学习的著作。
本书中重点研究了双人阶段博弈和矩阵博弈问题。 其中主要通过 3 个不同的
博弈游戏: 猜硬币、 石头 - 剪刀 - 布和囚徒困境来进行阐述。 这些都被称为矩阵
博弈 (matrix games) 或阶段博弈 (stage games) 的游戏, 因为在游戏过程中没
有发生状态转移。 本书没有过于深入研究博弈论本身, 而是专注于与这些游戏相
......
评论
发表评论