展开全部

主编推荐语

数据分析入门图书,基于Python,涵盖数据获取、清洗处理、建模分析,适合初学者。

内容简介

本书作为数据分析的入门图书,以Python语言为基础,介绍了数据分析的整个流程。本书内容涵盖数据的获取(即网络爬虫程序的设计)、前期数据的清洗和处理、运用机器学习算法进行建模分析,以及使用可视化的方法展示数据及结果。首先,书中不会涉及过于高级的语法,不过还是希望读者有一定的语法基础,这样可以更好地理解本书的内容。其次,本书重点在于应用Python来完成一些数据分析和数据处理的工作,即如何使用Python来完成工作而非专注于python语言语法等原理的讲解。本书目的是让初学者不论对数据分析流程本身还是Python语言,都能有一个十分直观的感受,为以后的深入学习打下基础。最后,读者不必须按顺序通读本书,因为各个章节层次比较分明,可以根据兴趣或者需要来自行安排。例如第五章介绍了一些实战的小项目,有趣且难度不大,大家可以在学习前面内容之余来阅读这部分内容。

目录

  • 版权信息
  • 前言
  • 本书的主要内容
  • 本书的读者对象
  • 测试环境及代码
  • 联系作者
  • 致谢
  • 读者服务
  • 1 准备
  • 1.1 开发环境搭建
  • 1.1.1 在Ubuntu系统下搭建Python集成开发环境
  • 1.1.2 在Windows系统下搭建Python集成开发环境
  • 1.1.3 三种安装第三方库的方法
  • 1.2 Python基础语法介绍
  • 1.2.1 if__name__=='__main__'
  • 1.2.2 列表解析式
  • 1.2.3 装饰器
  • 1.2.4 递归函数
  • 1.2.5 面向对象
  • 1.3 The Zen of Python
  • 参考文献
  • 2 数据的获取
  • 2.1 爬虫简介
  • 2.2 数据抓取实践
  • 2.2.1 请求网页数据
  • 2.2.2 网页解析
  • 2.2.3 数据的存储
  • 2.3 爬虫进阶
  • 2.3.1 异常处理
  • 2.3.2 robots.txt
  • 2.3.3 动态UA
  • 2.3.4 代理IP
  • 2.3.5 编码检测
  • 2.3.6 正则表达式入门
  • 2.3.7 模拟登录
  • 2.3.8 验证码问题
  • 2.3.9 动态加载内容的获取
  • 2.3.10 多线程与多进程
  • 2.4 爬虫总结
  • 参考文献
  • 3 数据的存取与清洗
  • 3.1 数据存取
  • 3.1.1 基本文件操作
  • 3.1.2 CSV文件的存取
  • 3.1.3 JSON文件的存取
  • 3.1.4 XLSX文件的存取
  • 3.1.5 MySQL数据库文件的存取
  • 3.2 NumPy
  • 3.2.1 NumPy简介
  • 3.2.2 NumPy基本操作
  • 3.3 pandas
  • 3.3.1 pandas简介
  • 3.3.2 Series与DataFrame的使用
  • 3.3.3 布尔值数组与函数应用
  • 3.4 数据的清洗
  • 3.4.1 编码问题
  • 3.4.2 缺失值的检测与处理
  • 3.4.3 去除异常值
  • 3.4.4 去除重复值与冗余信息
  • 3.4.5 注意事项
  • 参考文献
  • 4 数据的分析及可视化
  • 4.1 探索性数据分析
  • 4.1.1 基本流程
  • 4.1.2 数据降维
  • 4.2 机器学习入门
  • 4.2.1 机器学习简介
  • 4.2.2 决策树——机器学习算法的应用
  • 4.3 手动实现KNN算法
  • 4.3.1 特例——最邻近分类器
  • 4.3.2 KNN算法的完整实现
  • 4.4 数据可视化
  • 4.4.1 高质量作图工具——matplotlib
  • 4.4.2 快速作图工具——pandas与matplotlib
  • 4.4.3 简捷作图工具——seaborn与matplotlib
  • 4.4.4 词云图
  • 参考文献
  • 5 Python与生活
  • 5.1 定制一个新闻提醒服务
  • 5.1.1 新闻数据的抓取
  • 5.1.2 实现邮件发送功能
  • 5.1.3 定时执行及本地日志记录
  • 5.2 Python与数学
  • 5.2.1 估计π值
  • 5.2.2 三门问题
  • 5.2.3 解决LP与QP问题(选读)
  • 5.3 QQ群聊天记录数据分析
  • 参考文献
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。