展开全部

主编推荐语

从计算环境配置到机器学习的实战书籍,带你掌握计算机工具高效存储和分析数据,切实解决工作痛点 。

内容简介

一本对以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书。如何将数据格式读取到脚本中?如何操作、改变、清洗数据?如何对数据可视化?如何使用数据获得更深的洞察力、解答问题,或者开发统计或机器学习模型?本书涵盖了有效处理计算和统计的技巧,以常见用例为讲解手段,展示了可被用作分析、操作、可视化以及学习数据的众多开源Python工具。

目录

  • 版权信息
  • O'Reilly Media, Inc. 介绍
  • 业界评论
  • 译者序
  • 前言
  • 什么是数据科学
  • 目标读者
  • 为什么用Python
  • 内容概览
  • 使用代码示例
  • 软件安装注意事项
  • O'Reilly Safari
  • 联系我们
  • 电子书
  • 第1章 IPython:超越Python
  • 1.1 shell还是Notebook
  • 1.2 IPython的帮助和文档
  • 1.3 IPython shell中的快捷键
  • 1.4 IPython魔法命令
  • 1.5 输入和输出历史
  • 1.6 IPython和shell命令
  • 1.7 与shell相关的魔法命令
  • 1.8 错误和调试
  • 1.9 代码的分析和计时
  • 1.10 IPython参考资料
  • 第2章 NumPy入门
  • 2.1 理解Python中的数据类型
  • 2.2 NumPy数组基础
  • 2.3 NumPy数组的计算:通用函数
  • 2.4 聚合:最小值、最大值和其他值
  • 2.5 数组的计算:广播
  • 2.6 比较、掩码和布尔逻辑
  • 2.7 花哨的索引
  • 2.8 数组的排序
  • 2.9 结构化数据:NumPy的结构化数组
  • 第3章 Pandas数据处理
  • 3.1 安装并使用Pandas
  • 3.2 Pandas对象简介
  • 3.3 数据取值与选择
  • 3.4 Pandas数值运算方法
  • 3.5 处理缺失值
  • 3.6 层级索引
  • 3.7 合并数据集:Concat与Append操作
  • 3.8 合并数据集:合并与连接
  • 3.9 累计与分组
  • 3.10 数据透视表
  • 3.11 向量化字符串操作
  • 3.12 处理时间序列
  • 3.13 高性能Pandas:eval()与query()
  • 3.14 参考资料
  • 第4章 Matplotlib数据可视化
  • 4.1 Matplotlib常用技巧
  • 4.2 两种画图接口
  • 4.3 简易线形图
  • 4.4 简易散点图
  • 4.5 可视化异常处理
  • 4.6 密度图与等高线图
  • 4.7 频次直方图、数据区间划分和分布密度
  • 4.8 配置图例
  • 4.9 配置颜色条
  • 4.10 多子图
  • 4.11 文字与注释
  • 4.12 自定义坐标轴刻度
  • 4.13 Matplotlib自定义:配置文件与样式表
  • 4.14 用Matplotlib画三维图
  • 4.15 用Basemap可视化地理数据
  • 4.16 用Seaborn做数据可视化
  • 4.17 参考资料
  • 第5章 机器学习
  • 5.1 什么是机器学习
  • 5.2 Scikit-Learn简介
  • 5.3 超参数与模型验证
  • 5.4 特征工程
  • 5.5 专题:朴素贝叶斯分类
  • 5.6 专题:线性回归
  • 5.7 专题:支持向量机
  • 5.8 专题:决策树与随机森林
  • 5.9 专题:主成分分析
  • 5.10 专题:流形学习
  • 5.11 专题:k-means聚类
  • 5.12 专题:高斯混合模型
  • 5.13 专题:核密度估计
  • 5.14 应用:人脸识别管道
  • 5.15 机器学习参考资料
  • 关于作者
  • 关于封面
  • 看完了
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社·图灵出品

图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。