展开全部

主编推荐语

掌握特征工程基本原则和应用,增强机器学习算法效果。

内容简介

本书介绍大量特征工程技术,阐明特征工程的基本原则。主要内容包括:机器学习流程中的基本概念,数值型数据的基础特征工程,自然文本的特征工程,词频- 逆文档频率,高效的分类变量编码技术,主成分分析,模型堆叠,图像处理,等等。

目录

  • 版权信息
  • 版权声明
  • O'Reilly Media, Inc. 介绍
  • 业界评论
  • 前言
  • 简介
  • 排版约定
  • 使用示例代码
  • O'Reilly Safari
  • 联系我们
  • 致谢
  • 电子书
  • 第1章 机器学习流程
  • 1.1 数据
  • 1.2 任务
  • 1.3 模型
  • 1.4 特征
  • 1.5 模型评价
  • 第2章 简单而又奇妙的数值
  • 2.1 标量、向量和空间
  • 2.2 处理计数
  • 2.3 对数变换
  • 2.4 特征缩放/归一化
  • 2.5 交互特征
  • 2.6 特征选择
  • 2.7 小结
  • 2.8 参考文献
  • 第3章 文本数据:扁平化、过滤和分块
  • 3.1 元素袋:将自然文本转换为扁平向量
  • 3.2 使用过滤获取清洁特征
  • 3.3 意义的单位:从单词、n元词到短语
  • 3.4 小结
  • 3.5 参考文献
  • 第4章 特征缩放的效果:从词袋到 tf-idf
  • 4.1 tf-idf:词袋的一种简单扩展
  • 4.2 tf-idf方法测试
  • 4.3 深入研究:发生了什么
  • 4.4 小结
  • 4.5 参考文献
  • 第5章 分类变量:自动化时代的数据计数
  • 5.1 分类变量的编码
  • 5.2 处理大型分类变量
  • 5.3 小结
  • 5.4 参考文献
  • 第6章 数据降维:使用PCA挤压数据
  • 6.1 直观理解
  • 6.2 数学推导
  • 6.3 PCA实战
  • 6.4 白化与ZCA
  • 6.5 PCA的局限性与注意事项
  • 6.6 用例
  • 6.7 小结
  • 6.8 参考文献
  • 第7章 非线性特征化与k-均值模型堆叠
  • 7.1 k-均值聚类
  • 7.2 使用聚类进行曲面拼接
  • 7.3 用于分类问题的k-均值特征化
  • 7.4 优点、缺点以及陷阱
  • 7.5 小结
  • 7.6 参考文献
  • 第8章 自动特征生成:图像特征提取和深度学习
  • 8.1 最简单的图像特征(以及它们因何失效)
  • 8.2 人工特征提取:SIFT和HOG
  • 8.3 通过深度神经网络学习图像特征
  • 8.4 小结
  • 8.5 参考文献
  • 第9章 回到特征:建立学术论文推荐器
  • 9.1 基于项目的协同过滤
  • 9.2 第一关:数据导入、清理和特征解析
  • 9.3 第二关:更多特征工程和更智能的模型
  • 9.4 第三关:更多特征=更多信息
  • 9.5 小结
  • 9.6 参考文献
  • 附录 A 线性建模与线性代数基础
  • A.1 线性分类概述
  • A.2 矩阵的解析
  • A.3 线性系统求解
  • A.4 参考文献
  • 作者简介
  • 封面简介
  • 看完了
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社·图灵出品

图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。