展开全部

主编推荐语

全书涵盖分布式AI基础知识、进展及预测,适合专业人士学习参考。

内容简介

全书可分为五大部分,阐述了分布式人工智能的基础知识以及相关进展,包括分布式人工智能简介、分布式规划与优化、多智能体博弈、多智能体学习和分布式人工智能应用。除此之外,由于本领域尚处于蓬勃发展阶段,相关技术与应用层出不穷,因此书中还提供了研究者对于分布式人工智能发展的相关预测,主要集中在:第一,更复杂和更大规模的分布式人工智能问题的研究和解决;第二,分布式人工智能的安全性,鲁棒性和泛化性,这将极大地促进人们对于分布式人工智能问题的理解;第三,分布式人工智能的可解释性,这将使得人类能够理解算法的决策,为分布式人工智能的落地减少障碍。本书适合相关领域的从业者学习,也适合作为本领域研究者的案头参考。

目录

  • 封面
  • 版权信息
  • 内容简介
  • 前言
  • 第一部分 分布式人工智能简介
  • 1 概述
  • 1.1 研究背景
  • 1.1.1 前深度学习时代
  • 1.1.2 深度学习时代
  • 1.2 主要研究领域
  • 1.2.1 算法博弈论
  • 1.2.2 分布式问题求解
  • 1.2.3 多智能体规划
  • 1.2.4 多智能体学习
  • 1.2.5 分布式机器学习
  • 1.3 相关应用
  • 1.3.1 足球
  • 1.3.2 安全博弈
  • 1.3.3 扑克和麻将
  • 1.3.4 视频游戏
  • 1.4 当前热点与挑战
  • 1.4.1 超大规模分布式人工智能系统
  • 1.4.2 分布式人工智能系统的鲁棒性和安全性
  • 1.4.3 分布式人工智能决策的可解释性
  • 1.4.4 将传统和深度学习的方法结合
  • 参考文献
  • 第二部分 分布式规划与优化
  • 2 分布式规划
  • 2.1 研究背景
  • 2.2 分布式规划的决策模型
  • 2.3 分布式规划的离线算法
  • 2.3.1 离线精确规划算法
  • 2.3.2 离线近似规划算法
  • 2.4 分布式规划的在线算法
  • 2.4.1 在线协调机制
  • 2.4.2 在线通信策略
  • 2.5 当前热点与挑战
  • 参考文献
  • 3 分布式约束优化
  • 3.1 研究背景
  • 3.2 分布式约束优化问题
  • 3.2.1 约束网络
  • 3.2.2 基础概念
  • 3.3 求解算法分类
  • 3.4 完备求解算法
  • 3.4.1 基于搜索的完备求解算法:ADOPT
  • 3.4.2 基于推理的完备求解算法:DPOP
  • 3.5 非完备求解算法
  • 3.5.1 基于决策的局部搜索算法
  • 3.5.2 基于信念传播的推理算法:Max-sum
  • 3.6 基准测试问题和典型应用
  • 3.6.1 基准测试问题和评价指标
  • 3.6.2 典型应用
  • 3.7 当前热点与挑战
  • 参考文献
  • 第三部分 多智能体博弈
  • 4 纳什均衡求解
  • 4.1 研究背景
  • 4.2 正规形式博弈
  • 4.3 纳什均衡与纳什定理
  • 4.4 二人博弈纳什均衡求解算法
  • 4.4.1 二人博弈的表示形式
  • 4.4.2 支持枚举算法
  • 4.4.3 Lemke-Howson算法
  • 4.4.4 Lipton-Markakis-Mehta算法
  • 4.4.5 三种算法的总结与对比
  • 4.5 纳什均衡的计算复杂性
  • 4.6 当前热点与挑战
  • 参考文献
  • 5 机制设计
  • 5.1 研究背景
  • 5.2 什么是机制
  • 5.2.1 社会选择函数
  • 5.2.2 机制的实现与显示原理
  • 5.3 拍卖机制设计
  • 5.3.1 性质与设计目标
  • 5.3.2 社会福利最大化机制:VCG机制
  • 5.3.3 收益最大化机制:最优拍卖
  • 5.4 付费搜索拍卖
  • 5.5 当前热点与挑战
  • 参考文献
  • 6 合作博弈与社会选择
  • 6.1 研究背景
  • 6.2 合作博弈论
  • 6.2.1 合作博弈论的提出
  • 6.2.2 合作博弈的一般表示
  • 6.2.3 合作博弈的解
  • 6.3 核与稳定集
  • 6.3.1 核的提出
  • 6.3.2 核的计算方式
  • 6.3.3 稳定集
  • 6.4 核仁
  • 6.4.1 核仁的提出
  • 6.4.2 核仁的计算方式
  • 6.4.3 计算实例
  • 6.5 Shapley值
  • 6.5.1 Shapley值的提出
  • 6.5.2 Shapley值的计算方式
  • 6.5.3 计算实例
  • 6.6 社会选择
  • 6.6.1 社会选择理论的提出
  • 6.6.2 阿罗不可能性定理
  • 6.6.3 森的帕累托自由不可能定理
  • 6.7 应用场景
  • 6.7.1 合作博弈应用场景
  • 6.7.2 社会选择应用场景
  • 6.8 当前热点与挑战
  • 6.8.1 合作博弈研究趋势
  • 6.8.2 社会选择研究趋势
  • 参考文献
  • 7 博弈学习
  • 7.1 不完美信息扩展式博弈
  • 7.2 均衡计算
  • 7.2.1 纳什均衡
  • 7.2.2 纳什均衡的计算
  • 7.2.3 线性规划求解
  • 7.2.4 遗憾最小化算法
  • 7.2.5 虚拟遗憾最小化算法
  • 7.2.6 基于深度学习的方法
  • 7.3 对手利用
  • 7.3.1 对手建模
  • 7.3.2 对手利用的安全性
  • 7.4 小结
  • 参考文献
  • 第四部分 多智能体学习
  • 8 单智能体强化学习
  • 8.1 研究背景
  • 8.2 强化学习的基本设定
  • 8.2.1 强化学习模型
  • 8.2.2 马尔可夫决策过程
  • 8.3 动态规划
  • 8.3.1 值迭代
  • 8.3.2 策略迭代
  • 8.4 表格式的强化学习
  • 8.4.1 免模型的学习
  • 8.4.2 基于模型的学习
  • 8.5 深度强化学习
  • 8.5.1 基于值函数的深度强化学习
  • 8.5.2 基于策略梯度的深度强化学习
  • 8.5.3 基于行动者-评论家的深度强化学习
  • 8.6 基准测试平台与实际应用
  • 8.6.1 基准测试平台
  • 8.6.2 实际应用
  • 8.7 当前热点与挑战
  • 8.8 小结
  • 参考文献
  • 9 基于模型的强化学习
  • 9.1 Dyna:基于模型的强化学习经典方法
  • 9.2 打靶法
  • 9.3 基于模型的策略优化方法
  • 9.4 基于模型的方法:从单智能体到多智能体
  • 9.4.1 自适应对手智能体推演策略优化算法(AORPO)
  • 9.4.2 其他多智能体强化学习的基于模型的方法
  • 9.5 小结
  • 参考文献
  • 10 多智能体合作学习
  • 10.1 研究背景
  • 10.2 合作学习问题描述
  • 10.3 基于值函数的合作多智能体强化学习算法
  • 10.3.1 值分解学习框架
  • 10.3.2 线性值分解
  • 10.3.3 单调值分解
  • 10.3.4 IGM完备值分解
  • 10.4 基于策略的合作学习算法
  • 10.4.1 反事实策略梯度
  • 10.4.2 多智能体深度确定性策略梯度
  • 10.4.3 可分解的离策略多智能体策略梯度
  • 10.5 基准测试集
  • 10.5.1 多智能体小球环境MPE
  • 10.5.2 星际争霸Ⅱ多智能体挑战SMAC
  • 10.5.3 谷歌足球
  • 10.5.4 多智能体合作测试集MACO
  • 10.6 当前热点与挑战
  • 10.6.1 探索
  • 10.6.2 学习交流
  • 10.6.3 共享学习
  • 10.6.4 分层多智能体强化学习
  • 10.6.5 离线多智能体强化学习
  • 10.6.6 基于模型的多智能体合作学习
  • 10.6.7 多智能体合作学习的理论分析
  • 10.7 小结
  • 参考文献
  • 11 多智能体竞争学习
  • 11.1 研究背景
  • 11.2 竞争式问题描述
  • 11.3 基于对手建模的竞争学习算法
  • 11.3.1 隐式的对手建模方法
  • 11.3.2 显式的对手建模方法
  • 11.4 基于群体自博弈的竞争学习算法
  • 11.4.1 自博弈机制
  • 11.4.2 联盟训练
  • 11.5 实际应用
  • 11.6 小结
  • 参考文献
  • 第五部分 分布式人工智能应用
  • 12 安全博弈
  • 12.1 研究背景
  • 12.2 安全博弈模型与均衡
  • 12.2.1 Stackelberg均衡
  • 12.2.2 均衡求解
  • 12.2.3 Stackelberg安全博弈模型及求解
  • 12.2.4 安全博弈实例
  • 12.3 复杂环境下的安全博弈
  • 12.3.1 信息不完全与不确定性
  • 12.3.2 复杂策略空间的处理
  • 12.3.3 动态安全博弈
  • 12.4 实际应用与成功案例
  • 12.4.1 重要基础设施保护
  • 12.4.2 交通系统安保调度
  • 12.4.3 打击环境资源犯罪与城市犯罪
  • 12.4.4 打击犯罪网络
  • 12.4.5 其他应用
  • 12.5 当前热点与挑战
  • 12.5.1 研究热点
  • 12.5.2 未来研究方向
  • 12.5.3 未来应用领域
  • 参考文献
  • 13 社交网络中的机制设计
  • 13.1 研究背景
  • 13.2 传播网络与传播机制
  • 13.3 VCG在网络上的扩展
  • 13.3.1 具有传播激励的VCG拍卖
  • 13.3.2 传播拍卖的不可能性定理
  • 13.4 基于关键传播路径的拍卖机制
  • 13.4.1 关键传播序列
  • 13.4.2 信息传播机制
  • 13.4.3 关键传播机制
  • 13.4.4 阈值邻接机制
  • 13.5 当前热点与挑战
  • 参考文献
  • 后折页
  • 封底
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。