展开全部

主编推荐语

介绍数据科学的重量级读本,Google数据科学家作品。

内容简介

本书从零开始着手数据科学工作,基于易于理解且具有数据科学相关的丰富的库的Python语言环境。具体内容包括:Python速成,可视化数据,线性代数,统计,概率,假设与推断,梯度下降法,如何获取数据,K近邻法,朴素贝叶斯算法,等等。

目录

  • 版权信息
  • O'Reilly Media, Inc.介绍
  • 业界评论
  • 前言
  • 数据科学
  • 从零开始
  • 本书排版约定
  • 示例代码的使用
  • Safari® Books Online
  • 联系我们
  • 致谢
  • 第1章 导论
  • 1.1 数据的威力
  • 1.2 什么是数据科学
  • 1.3 激励假设:DataSciencester
  • 1.3.1 寻找关键联系人
  • 1.3.2 你可能知道的数据科学家
  • 1.3.3 工资与工作年限
  • 1.3.4 付费账户
  • 1.3.5 兴趣主题
  • 1.4 展望
  • 第2章 Python速成
  • 2.1 基础内容
  • 2.1.1 Python获取
  • 2.1.2 Python之禅
  • 2.1.3 空白形式
  • 2.1.4 模块
  • 2.1.5 算法
  • 2.1.6 函数
  • 2.1.7 字符串
  • 2.1.8 异常
  • 2.1.9 列表
  • 2.1.10 元组
  • 2.1.11 字典
  • 2.1.12 集合
  • 2.1.13 控制流
  • 2.1.14 真和假
  • 2.2 进阶内容
  • 2.2.1 排序
  • 2.2.2 列表解析
  • 2.2.3 生成器和迭代器
  • 2.2.4 随机性
  • 2.2.5 正则表达式
  • 2.2.6 面向对象的编程
  • 2.2.7 函数式工具
  • 2.2.8 枚举
  • 2.2.9 压缩和参数拆分
  • 2.2.10 args和kwargs
  • 2.2.11 欢迎来到DataSciencester
  • 2.3 延伸学习
  • 第3章 可视化数据
  • 3.1 matplotlib
  • 3.2 条形图
  • 3.3 线图
  • 3.4 散点图
  • 3.5 延伸学习
  • 第4章 线性代数
  • 4.1 向量
  • 4.2 矩阵
  • 4.3 延伸学习
  • 第5章 统计学
  • 5.1 描述单个数据集
  • 5.1.1 中心倾向
  • 5.1.2 离散度
  • 5.2 相关
  • 5.3 辛普森悖论
  • 5.4 相关系数其他注意事项
  • 5.5 相关和因果
  • 5.6 延伸学习
  • 第6章 概率
  • 6.1 不独立和独立
  • 6.2 条件概率
  • 6.3 贝叶斯定理
  • 6.4 随机变量
  • 6.5 连续分布
  • 6.6 正态分布
  • 6.7 中心极限定理
  • 6.8 延伸学习
  • 第7章 假设与推断
  • 7.1 统计假设检验
  • 7.2 案例:掷硬币
  • 7.3 置信区间
  • 7.4 P-hacking
  • 7.5 案例:运行A/B测试
  • 7.6 贝叶斯推断
  • 7.7 延伸学习
  • 第8章 梯度下降
  • 8.1 梯度下降的思想
  • 8.2 估算梯度
  • 8.3 使用梯度
  • 8.4 选择正确步长
  • 8.5 综合
  • 8.6 随机梯度下降法
  • 8.7 延伸学习
  • 第9章 获取数据
  • 9.1 stdin和stdout
  • 9.2 读取文件
  • 9.2.1 文本文件基础
  • 9.2.2 限制的文件
  • 9.3 网络抓取
  • 9.3.1 HTML和解析方法
  • 9.3.2 案例:关于数据的O'Reilly图书
  • 9.4 使用API
  • 9.4.1 JSON(和XML)
  • 9.4.2 使用无验证的API
  • 9.4.3 寻找API
  • 9.5 案例:使用Twitter API
  • 获取证明文件
  • 9.6 延伸学习
  • 第10章 数据工作
  • 10.1 探索你的数据
  • 10.1.1 探索一维数据
  • 10.1.2 二维数据
  • 10.1.3 多维数据
  • 10.2 清理与修改
  • 10.3 数据处理
  • 10.4 数据调整
  • 10.5 降维
  • 10.6 延伸学习
  • 第11章 机器学习
  • 11.1 建模
  • 11.2 什么是机器学习
  • 11.3 过拟合和欠拟合
  • 11.4 正确性
  • 11.5 偏倚-方差权衡
  • 11.6 特征提取和选择
  • 11.7 延伸学习
  • 第12章 k 近邻法
  • 12.1 模型
  • 12.2 案例:最喜欢的编程语言
  • 12.3 维数灾难
  • 12.4 延伸学习
  • 第13章 朴素贝叶斯算法
  • 13.1 一个简易的垃圾邮件过滤器
  • 13.2 一个复杂的垃圾邮件过滤器
  • 13.3 算法的实现
  • 13.4 测试模型
  • 13.5 延伸学习
  • 第14章 简单线性回归
  • 14.1 模型
  • 14.2 利用梯度下降法
  • 14.3 最大似然估计
  • 14.4 延伸学习
  • 第15章 多重回归分析
  • 15.1 模型
  • 15.2 最小二乘模型的进一步假设
  • 15.3 拟合模型
  • 15.4 解释模型
  • 15.5 拟合优度
  • 15.6 题外话:Bootstrap
  • 15.7 回归系数的标准误差
  • 15.8 正则化
  • 15.9 延伸学习
  • 第16章 逻辑回归
  • 16.1 问题
  • 16.2 Logistic函数
  • 16.3 应用模型
  • 16.4 拟合优度
  • 16.5 支持向量机
  • 16.6 延伸学习
  • 第17章 决策树
  • 17.1 什么是决策树
  • 17.2 熵
  • 17.3 分割之熵
  • 17.4 创建决策树
  • 17.5 综合运用
  • 17.6 随机森林
  • 17.7 延伸学习
  • 第18章 神经网络
  • 18.1 感知器
  • 18.2 前馈神经网络
  • 18.3 反向传播
  • 18.4 实例:战胜CAPTCHA
  • 18.5 延伸学习
  • 第19章 聚类分析
  • 19.1 原理
  • 19.2 模型
  • 19.3 示例:聚会
  • 19.4 选择聚类数目k
  • 19.5 示例:对色彩进行聚类
  • 19.6 自下而上的分层聚类
  • 19.7 延伸学习
  • 第20章 自然语言处理
  • 20.1 词云
  • 20.2 n-grams模型
  • 20.3 语法
  • 20.4 题外话:吉布斯采样
  • 20.5 主题建模
  • 20.6 延伸学习
  • 第21章 网络分析
  • 21.1 中介中心度
  • 21.2 特征向量中心度
  • 21.2.1 矩阵乘法
  • 21.2.2 中心度
  • 21.3 有向图与PageRank
  • 21.4 延伸学习
  • 第22章 推荐系统
  • 22.1 手工甄筛
  • 22.2 推荐流行事物
  • 22.3 基于用户的协同过滤方法
  • 22.4 基于物品的协同过滤算法
  • 22.5 延伸学习
  • 第23章 数据库与SQL
  • 23.1 CREATE TABLE与INSERT
  • 23.2 UPDATE
  • 23.3 DELETE
  • 23.4 SELECT
  • 23.5 GROUP BY
  • 23.6 ORDER BY
  • 237 JOIN
  • 23.8 子查询
  • 23.9 索引
  • 23.10 查询优化
  • 23.11 NoSQL
  • 23.12 延伸学习
  • 第24章 MapReduce
  • 24.1 案例:单词计数
  • 24.2 为什么是MapReduce
  • 24.3 更加一般化的MapReduce
  • 24.4 案例:分析状态更新
  • 24.5 案例:矩阵计算
  • 24.6 题外话:组合器
  • 24.7 延伸学习
  • 第25章 数据科学前瞻
  • 25.1 IPython
  • 25.2 数学
  • 25.3 不从零开始
  • 25.3.1 NumPy
  • 25.3.2 pandas
  • 25.3.3 scikit-learn
  • 25.3.4 可视化
  • 25.3.5 R
  • 25.4 寻找数据
  • 25.5 从事数据科学
  • 25.5.1 Hacker News
  • 25.5.2 消防车
  • 25.5.3 T恤
  • 25.5.4 你呢?
  • 作者简介
  • 关于封面
  • 看完了
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社·图灵出品

图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。