展开全部

主编推荐语

从运行Python的实践中学习深度强化学习,一本可以自己尝试上手操作的指南性书籍。

内容简介

近年来,机器学习受到了人们的广泛关注。本书面向普通大众,指导读者在Python(基于Chainer和OpenAI Gym)中实践深度强化学习。

读者只需要具备一些基本的编程经验即可读懂书中内容,通过实现具体程序来掌握深度强化学习的相关知识。

目录

  • 版权信息
  • 关于本书
  • 作者简介
  • 译者简介
  • 译者序
  • 前言
  • 第1章 引言
  • 1.1 深度强化学习可以做什么
  • 1.2 本书的结构
  • 1.3 框架:Chainer和ChainerRL
  • 1.4 Python的运行检查
  • 1.5 Chainer的安装
  • 1.6 ChainerRL的安装
  • 1.7 模拟器:OpenAI Gym
  • 第2章 深度学习
  • 2.1 什么是深度学习
  • 2.2 神经网络
  • 2.3 基于Chainer的神经网络
  • 2.3.1 Chainer与神经网络的对应
  • 2.3.2 Chainer程序
  • 2.3.3 参数设置
  • 2.3.4 创建数据
  • 2.3.5 定义神经网络
  • 2.3.6 各种声明
  • 2.3.7 显示训练状态
  • 2.3.8 保存训练状态
  • 2.3.9 执行训练
  • 2.4 与其他神经网络的对应
  • 2.4.1 感知器
  • 2.4.2 5层神经网络(深度学习)
  • 2.4.3 计算输入中的1的数量
  • 2.5 基于深度神经网络的手写数字识别
  • 2.5.1 手写数字的输入格式
  • 2.5.2 深度神经网络的结构
  • 2.5.3 8×8的手写数字数据
  • 2.6 基于卷积神经网络的手写数字识别
  • 2.6.1 卷积
  • 2.6.2 激活函数
  • 2.6.3 池化
  • 2.6.4 执行
  • 2.7 一些技巧
  • 2.7.1 读取文件数据
  • 2.7.2 使用训练模型
  • 2.7.3 重启训练
  • 2.7.4 检查权重
  • 2.7.5 从文件中读取手写数字
  • 第3章 强化学习
  • 3.1 什么是强化学习
  • 3.1.1 有监督学习
  • 3.1.2 无监督学习
  • 3.1.3 半监督学习
  • 3.2 强化学习原理
  • 3.3 通过简单的示例来学习
  • 3.4 应用到Q学习问题中
  • 3.4.1 状态
  • 3.4.2 行动
  • 3.4.3 奖励
  • 3.4.4 Q值
  • 3.5 使用Python进行训练
  • 3.5.1 运行程序
  • 3.5.2 说明程序
  • 3.6 基于OpenAI Gym的倒立摆
  • 3.6.1 运行程序
  • 3.6.2 说明程序
  • 3.7 如何保存和加载Q值
  • 第4章 深度强化学习
  • 4.1 什么是深度强化学习
  • 4.2 对于老鼠学习问题的应用
  • 4.2.1 运行程序
  • 4.2.2 说明程序
  • 4.2.3 如何保存和读取智能体模型
  • 4.3 基于OpenAI Gym的倒立摆
  • 4.3.1 运行程序
  • 4.3.2 说明程序
  • 4.4 基于OpenAI Gym的太空侵略者
  • 4.5 基于OpenAI Gym的颠球
  • 4.5.1 运行程序
  • 4.5.2 说明程序
  • 4.6 对战游戏
  • 4.6.1 黑白棋
  • 4.6.2 训练方法
  • 4.6.3 变更盘面
  • 4.6.4 黑白棋实体
  • 4.6.5 如何与人类对战
  • 4.6.6 卷积神经网络的应用
  • 4.7 使用物理引擎进行模拟
  • 4.7.1 物理引擎
  • 4.7.2 运行程序
  • 4.7.3 说明程序
  • 4.8 物理引擎在颠球问题中的应用
  • 4.9 物理引擎在倒立摆问题中的应用
  • 4.10 物理引擎在机械臂问题中的应用
  • 4.11 使用其他深度强化学习方法
  • 4.11.1 深度强化学习的类型
  • 4.11.2 将训练方法更改为DDQN
  • 4.11.3 将训练方法更改为PER-DQN
  • 4.11.4 将训练方法更改为DDPG
  • 4.11.5 将训练方法更改为A3C
  • 第5章 实际环境中的应用
  • 5.1 使用摄像机观察环境(MNIST)
  • 5.1.1 摄像机设置
  • 5.1.2 通过卷积神经网络对摄像机图像进行分类
  • 5.1.3 使用图像大小为28×28的手写数字进行训练
  • 5.2 实际环境中的老鼠学习问题
  • 5.3 使用Raspberry Pi处理老鼠学习问题
  • 5.3.1 环境构建
  • 5.3.2 以输入输出为重点的简化
  • 5.3.3 使用摄像机测量环境
  • 5.4 使用Arduino + PC处理老鼠学习问题
  • 5.4.1 环境构建
  • 5.4.2 以输入输出为重点的简化
  • 5.4.3 使用摄像机测量环境
  • 5.5 使用Raspberry Pi + Arduino处理老鼠学习问题
  • 5.6 结语
  • 附录
  • A.1 VirtualBox的安装
  • A.1.1 复制和粘贴
  • A.1.2 共享文件夹
  • A.2 Raspberry Pi的设置
  • A.2.1 操作系统安装
  • A.2.2 程序的传输设置
  • A.2.3 RC伺服电动机的设置
  • A.3 安装Arduino
  • A.4 GPU的使用
  • A.4.1 在安装CuPy之前
  • A.4.2 CuPy的使用方法
  • A.5 使用Intel Math Kernel Library安装NumPy
展开全部

评分及书评

评分不足
2个评分

出版方

机械工业出版社有限公司

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。