展开全部

主编推荐语

大数据与AI教程:数据准备、清洗、特征处理,强调实践、案例教学,基础与前沿相结合。

内容简介

本教程以大数据和人工智能专业的学生为读者对象,讲解数据准备、数据清洗、特征工程、特征选择和划分数据集的方法与实践,从而使学习者掌握数据准备和预处理的流程及常用方法,为将来的项目实践奠定基础。强调工程实践,这也是本书作者所有书籍的共同特点。书中通过大量案例,向读者演示了各种方法的具体实现方式。基础与前沿结合。书中在“基础知识”环节介绍相关的基本实现方法,但是因为现实项目的复杂性,除了基础知识之外,在具体项目中,还会用到各种工具,也包括最新的研发成果。为此专设了“扩展探究”,读者通过此“天窗“了解更精彩的内容。以案例为载体,传授思想方法。数据科学项目需要严谨、科学的思想方法,这些方法又不是简单说教就能让学习者掌握的,本书中以“项目案例”为载体,不仅讲述操作技法,还让读者体验其中的思想方法,并且在“动手练习”中提供了练习项目,借以检验和巩固所学内容。

目录

  • 封面
  • 书名页
  • 内容简介
  • 版权页
  • 前 言
  • 目录
  • 第1章 感知数据
  • 1.0 了解数据科学项目
  • 1.1 文件中的数据
  • 1.1.1 CSV文件
  • 1.1.2 Excel文件
  • 1.1.3 图像文件
  • 1.2 数据库中的数据
  • 1.3 网页上的数据
  • 1.4 来自API的数据
  • 第2章 数据清理
  • 2.0 基本概念
  • 2.1 转化数据类型
  • 2.2 处理重复数据
  • 2.3 处理缺失数据
  • 2.3.1 检查缺失数据
  • 2.3.2 用指定值填补
  • 2.3.3 根据规律填补
  • 2.4 处理离群数据
  • 第3章 特征变换
  • 3.0 特征的类型
  • 3.1 特征数值化
  • 3.2 特征二值化
  • 3.3 OneHot编码
  • 3.4 数据变换
  • 3.5 特征离散化
  • 3.5.1 无监督离散化
  • 3.5.2 有监督离散化
  • 3.6 数据规范化
  • 第4章 特征选择
  • 4.0 特征选择简述
  • 4.1 封装器法
  • 4.1.1 循序特征选择
  • 4.1.2 穷举特征选择
  • 4.1.3 递归特征消除
  • 4.2 过滤器法
  • 4.3 嵌入法
  • 第5章 特征抽取
  • 5.1 无监督特征抽取
  • 5.1.1 主成分分析
  • 5.1.2 因子分析
  • 5.2 有监督特征抽取
  • 附录A Jupyter简介
  • 附录B NumPy简介
  • 附录C Pandas简介
  • 附录D Matplotlib简介
  • 后 记
  • 反侵权盗版声明
  • 封底
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。