展开全部

主编推荐语

机器学习入门书,以Python语言介绍。

内容简介

本书主要内容包括:机器学习的基本概念及其应用;实践中最常用的机器学习算法以及这些算法的优缺点;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;管道的概念;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。

目录

  • 版权信息
  • O'Reilly Media, Inc. 介绍
  • 前言
  • 第1章 引言
  • 1.1 为何选择机器学习
  • 1.2 为何选择Python
  • 1.3 scikit-learn
  • 1.4 必要的库和工具
  • 1.5 Python 2与Python 3的对比
  • 1.6 本书用到的版本
  • 1.7 第一个应用:鸢尾花分类
  • 1.8 小结与展望
  • 第2章 监督学习
  • 2.1 分类与回归
  • 2.2 泛化、过拟合与欠拟合
  • 2.3 监督学习算法
  • 2.4 分类器的不确定度估计
  • 2.5 小结与展望
  • 第3章 无监督学习与预处理
  • 3.1 无监督学习的类型
  • 3.2 无监督学习的挑战
  • 3.3 预处理与缩放
  • 3.4 降维、特征提取与流形学习
  • 3.5 聚类
  • 3.6 小结与展望
  • 第4章 数据表示与特征工程
  • 4.1 分类变量
  • 4.2 分箱、离散化、线性模型与树
  • 4.3 交互特征与多项式特征
  • 4.4 单变量非线性变换
  • 4.5 自动化特征选择
  • 4.6 利用专家知识
  • 4.7 小结与展望
  • 第5章 模型评估与改进
  • 5.1 交叉验证
  • 5.2 网格搜索
  • 5.3 评估指标与评分
  • 5.4 小结与展望
  • 第6章 算法链与管道
  • 6.1 用预处理进行参数选择
  • 6.2 构建管道
  • 6.3 在网格搜索中使用管道
  • 6.4 通用的管道接口
  • 6.5 网格搜索预处理步骤与模型参数
  • 6.6 网格搜索选择使用哪个模型
  • 6.7 小结与展望
  • 第7章 处理文本数据
  • 7.1 用字符串表示的数据类型
  • 7.2 示例应用:电影评论的情感分析
  • 7.3 将文本数据表示为词袋
  • 7.4 停用词
  • 7.5 用tf-idf缩放数据
  • 7.6 研究模型系数
  • 7.7 多个单词的词袋(n元分词)
  • 7.8 高级分词、词干提取与词形还原
  • 7.9 主题建模与文档聚类
  • 7.10 小结与展望
  • 第8章 全书总结
  • 8.1 处理机器学习问题
  • 8.2 从原型到生产
  • 8.3 测试生产系统
  • 8.4 构建你自己的估计器
  • 8.5 下一步怎么走
  • 8.6 总结
  • 关于作者
  • 关于封面
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社·图灵出品

图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。