人工智能
类型
8.6
豆瓣评分
可以朗读
语音朗读
246千字
字数
2015-04-01
发行日期
展开全部
主编推荐语
全面介绍多种重要的机器学习算法和案例分析。
内容简介
R本身是一款十分优秀的数据分析和数据可视化软件。本书通过将实践案例与核心的理论知识相结合,提供了你开始将机器学习应用到你自己项目中所需要的知识。主要内容:机器学习的基本概念和理论,用于机器学习的R软件环境;如何应用R来管理数据,进行数据的探索分析和数据可视化;典型的机器学习算法和案例,并给出了详细的分析步骤;模型性能评价的原理和方法;提高模型性能的几种常用方法;其他机器学习主题。本书适用于任何希望使用数据来采取行动的人。读者只需要具有R的一些基本知识,不需要具备机器学习的深厚基础。不管是R初学者,还是熟练的R用户都能从书中找到对自己有用的内容。
目录
- 版权信息
- 推荐序
- 译者序
- 前言
- 致谢
- 关于技术评审人
- 第1章 机器学习简介
- 1.1 机器学习的起源
- 1.2 机器学习的使用与滥用
- 1.3 机器如何学习
- 1.3.1 抽象化和知识表达
- 1.3.2 一般化
- 1.3.3 评估学习的成功性
- 1.4 将机器学习应用于数据中的步骤
- 1.5 选择机器学习算法
- 1.5.1 考虑输入的数据
- 1.5.2 考虑机器学习算法的类型
- 1.5.3 为数据匹配合适的算法
- 1.6 使用R进行机器学习
- 1.7 总结
- 第2章 数据的管理和理解
- 2.1 R数据结构
- 2.2 向量
- 2.3 因子
- 2.3.1 列表
- 2.3.2 数据框
- 2.3.3 矩阵和数组
- 2.4 用R管理数据
- 2.4.1 保存和加载R数据结构
- 2.4.2 用CSV文件导入和保存数据
- 2.4.3 从SQL数据库导入数据
- 2.5 探索和理解数据
- 2.5.1 探索数据的结构
- 2.5.2 探索数值型变量
- 2.5.3 探索分类变量
- 2.5.4 探索变量之间的关系
- 2.6 总结
- 第3章 懒惰学习——使用近邻分类
- 3.1 理解使用近邻进行分类
- 3.1.1 kNN算法
- 3.1.2 为什么kNN算法是懒惰的
- 3.2 用kNN算法诊断乳腺癌
- 3.2.1 第1步——收集数据
- 3.2.2 第2步——探索和准备数据
- 3.2.3 第3步——基于数据训练模型
- 3.2.4 第4步——评估模型的性能
- 3.2.5 第5步——提高模型的性能
- 3.3 总结
- 第4章 概率学习——朴素贝叶斯分类
- 4.1 理解朴素贝叶斯
- 4.1.1 贝叶斯方法的基本概念
- 4.1.2 朴素贝叶斯算法
- 4.2 例子——基于贝叶斯算法的手机垃圾短信过滤
- 4.2.1 第1步——收集数据
- 4.2.2 第2步——探索和准备数据
- 4.2.3 数据准备——处理和分析文本数据
- 4.2.4 第3步——基于数据训练模型
- 4.2.5 第4步——评估模型的性能
- 4.2.6 第5步——提升模型的性能
- 4.3 总结
- 第5章 分而治之——应用决策树和规则进行分类
- 5.1 理解决策树
- 5.1.1 分而治之
- 5.1.2 C5.0决策树算法
- 5.2 例子——使用C5.0决策树识别高风险银行贷款
- 5.2.1 第1步——收集数据
- 5.2.2 第2步——探索和准备数据
- 5.2.3 第3步——基于数据训练模型
- 5.2.4 第4步——评估模型的性能
- 5.2.5 第5步——提高模型的性能
- 5.3 理解分类规则
- 5.3.1 独立而治之
- 5.3.2 单规则(1R)算法
- 5.3.3 RIPPER算法
- 5.3.4 来自决策树的规则
- 5.4 例子——应用规则学习识别有毒的蘑菇
- 5.4.1 第1步——收集数据
- 5.4.2 第2步——探索和准备数据
- 5.4.3 第3步——基于数据训练模型
- 5.4.4 第4步——评估模型的性能
- 5.4.5 第5步——提高模型的性能
- 5.5 总结
- 第6章 预测数值型数据——回归方法
- 6.1 理解回归
- 6.1.1 简单线性回归
- 6.1.2 普通最小二乘估计
- 6.1.3 相关系数
- 6.1.4 多元线性回归
- 6.2 例子——应用线性回归预测医疗费用
- 6.2.1 第1步——收集数据
- 6.2.2 第2步——探索和准备数据
- 6.2.3 第3步——基于数据训练模型
- 6.2.4 第4步——评估模型的性能
- 6.2.5 第5步——提高模型的性能
- 6.3 理解回归树和模型树
- 6.4 例子——用回归树和模型树估计葡萄酒的质量
- 6.4.1 第1步——收集数据
- 6.4.2 第2步——探索和准备数据
- 6.4.3 第3步——基于数据训练模型
- 6.4.4 第4步——评估模型的性能
- 6.4.5 第5步——提高模型的性能
- 6.5 总结
- 第7章 黑箱方法——神经网络和支持向量机
- 7.1 理解神经网络
- 7.1.1 从生物神经元到人工神经元
- 7.1.2 激活函数
- 7.1.3 网络拓扑
- 7.1.4 用后向传播训练神经网络
- 7.2 用人工神经网络对混凝土的强度进行建模
- 7.2.1 第1步——收集数据
- 7.2.2 第2步——探索和准备数据
- 7.2.3 第3步——基于数据训练模型
- 7.2.4 第4步——评估模型的性能
- 7.2.5 第5步——提高模型的性能
- 7.3 理解支持向量机
- 7.3.1 用超平面分类
- 7.3.2 寻找最大间隔
- 7.3.3 对非线性空间使用核函数
- 7.4 用支持向量机进行光学字符识别
- 7.4.1 第1步——收集数据
- 7.4.2 第2步——探索和准备数据
- 7.4.3 第3步——基于数据训练模型
- 7.4.4 第4步——评估模型的性能
- 7.4.5 第5步——提高模型的性能
- 7.5 总结
- 第8章 探寻模式——基于关联规则的购物篮分析
- 8.1 理解关联规则
- 8.2 例子——用关联规则确定经常一起购买的食品杂货
- 8.2.1 第1步——收集数据
- 8.2.2 第2步——探索和准备数据
- 8.2.3 第3步——基于数据训练模型
- 8.2.4 第4步——评估模型的性能
- 8.2.5 第5步——提高模型的性能
- 8.3 总结
- 第9章 寻找数据的分组——k均值聚类
- 9.1 理解聚类
- 9.1.1 聚类——一种机器学习任务
- 9.1.2 k均值聚类算法
- 9.1.3 用k均值聚类探寻青少年市场细分
- 9.1.4 第1步——收集数据
- 9.1.5 第2步——探索和准备数据
- 9.1.6 第3步——基于数据训练模型
- 9.1.7 第4步——评估模型的性能
- 9.1.8 第5步——提高模型的性能
- 9.2 总结
- 第10章 模型性能的评价
- 10.1 度量分类方法的性能
- 10.1.1 在R中处理分类预测数据
- 10.1.2 深入探讨混淆矩阵
- 10.1.3 使用混淆矩阵度量性能
- 10.1.4 准确度之外的其他性能评价指标
- 10.1.5 性能权衡的可视化
- 10.2 评估未来的性能
- 10.2.1 保持法
- 10.2.2 交叉验证
- 10.2.3 自助法抽样
- 10.3 总结
- 第11章 提高模型的性能
- 11.1 调整多个模型来提高性能
- 11.2 使用元学习来提高模型的性能
- 11.2.1 理解集成学习
- 11.2.2 bagging
- 11.2.3 boosting
- 11.2.4 随机森林
- 11.3 总结
- 第12章 其他机器学习主题
- 12.1 分析专用数据
- 12.1.1 用RCurl添加包从网上获取数据
- 12.1.2 用XML添加包读/写XML格式数据
- 12.1.3 用rjson添加包读/写JSON
- 12.1.4 用xlsx添加包读/写Microsoft Excel电子表格
- 12.1.5 生物信息学数据
- 12.1.6 社交网络数据和图数据
- 12.2 提高R语言的性能
- 12.2.1 处理非常大的数据集
- 12.2.2 使用并行处理来加快学习过程
- 12.2.3 GPU计算
- 12.2.4 部署最优的学习算法
- 12.3 总结
展开全部
出版方
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。
