人工智能
类型
7.7
豆瓣评分
可以朗读
语音朗读
149千字
字数
2019-04-01
发行日期
展开全部
主编推荐语
掌握特征工程基本原则和应用,增强机器学习算法效果。
内容简介
本书介绍大量特征工程技术,阐明特征工程的基本原则。主要内容包括:机器学习流程中的基本概念,数值型数据的基础特征工程,自然文本的特征工程,词频- 逆文档频率,高效的分类变量编码技术,主成分分析,模型堆叠,图像处理,等等。
目录
- 版权信息
- 版权声明
- O'Reilly Media, Inc. 介绍
- 业界评论
- 前言
- 简介
- 排版约定
- 使用示例代码
- O'Reilly Safari
- 联系我们
- 致谢
- 电子书
- 第1章 机器学习流程
- 1.1 数据
- 1.2 任务
- 1.3 模型
- 1.4 特征
- 1.5 模型评价
- 第2章 简单而又奇妙的数值
- 2.1 标量、向量和空间
- 2.2 处理计数
- 2.3 对数变换
- 2.4 特征缩放/归一化
- 2.5 交互特征
- 2.6 特征选择
- 2.7 小结
- 2.8 参考文献
- 第3章 文本数据:扁平化、过滤和分块
- 3.1 元素袋:将自然文本转换为扁平向量
- 3.2 使用过滤获取清洁特征
- 3.3 意义的单位:从单词、n元词到短语
- 3.4 小结
- 3.5 参考文献
- 第4章 特征缩放的效果:从词袋到 tf-idf
- 4.1 tf-idf:词袋的一种简单扩展
- 4.2 tf-idf方法测试
- 4.3 深入研究:发生了什么
- 4.4 小结
- 4.5 参考文献
- 第5章 分类变量:自动化时代的数据计数
- 5.1 分类变量的编码
- 5.2 处理大型分类变量
- 5.3 小结
- 5.4 参考文献
- 第6章 数据降维:使用PCA挤压数据
- 6.1 直观理解
- 6.2 数学推导
- 6.3 PCA实战
- 6.4 白化与ZCA
- 6.5 PCA的局限性与注意事项
- 6.6 用例
- 6.7 小结
- 6.8 参考文献
- 第7章 非线性特征化与k-均值模型堆叠
- 7.1 k-均值聚类
- 7.2 使用聚类进行曲面拼接
- 7.3 用于分类问题的k-均值特征化
- 7.4 优点、缺点以及陷阱
- 7.5 小结
- 7.6 参考文献
- 第8章 自动特征生成:图像特征提取和深度学习
- 8.1 最简单的图像特征(以及它们因何失效)
- 8.2 人工特征提取:SIFT和HOG
- 8.3 通过深度神经网络学习图像特征
- 8.4 小结
- 8.5 参考文献
- 第9章 回到特征:建立学术论文推荐器
- 9.1 基于项目的协同过滤
- 9.2 第一关:数据导入、清理和特征解析
- 9.3 第二关:更多特征工程和更智能的模型
- 9.4 第三关:更多特征=更多信息
- 9.5 小结
- 9.6 参考文献
- 附录 A 线性建模与线性代数基础
- A.1 线性分类概述
- A.2 矩阵的解析
- A.3 线性系统求解
- A.4 参考文献
- 作者简介
- 封面简介
- 看完了
展开全部
出版方
人民邮电出版社·图灵出品
图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。