展开全部

主编推荐语

本书介绍了如何借助计算而非数学方法,使用Python语言对数据进行统计分析。

内容简介

本书是一本以全新视角讲解概率统计的入门图书。抛开经典的数学分析,Downey手把手教你用编程理解统计学。 具体说来,本书通过一个案例研究,介绍探索性数据分析的全过程:从收集数据、生成统计信息,到发现模式、验证假设。同时研究分布、概率规则、可视化和其他多种工具及概念。此外,第2版新增了回归、时间序列分析、生存分析和分析方法等章节。

目录

  • 版权信息
  • 版权声明
  • O'Reilly Media, Inc. 介绍
  • 业界评论
  • 前言
  • 写作思路
  • 本书代码
  • 致谢
  • Safari® Books Online
  • 联系我们
  • 第1章 探索性数据分析
  • 1.1 统计学方法
  • 1.2 全国家庭增长调查
  • 1.3 数据导入
  • 1.4 DataFrame
  • 1.5 变量
  • 1.6 数据变换
  • 1.7 数据验证
  • 1.8 解释数据
  • 1.9 练习
  • 1.10 术语
  • 第2章 分布
  • 2.1 表示直方图
  • 2.2 绘制直方图
  • 2.3 全国家庭增长调查中的变量
  • 2.4 离群值
  • 2.5 第一胎
  • 2.6 分布概述
  • 2.7 方差
  • 2.8 效应量
  • 2.9 报告结果
  • 2.10 练习
  • 2.11 术语
  • 第3章 概率质量函数
  • 3.1 概率质量函数
  • 3.2 绘制PMF
  • 3.3 绘制PMF的其他方法
  • 3.4 课堂规模悖论
  • 3.5 使用DataFrame进行索引
  • 3.6 练习
  • 3.7 术语
  • 第4章 累积分布函数
  • 4.1 PMF的局限
  • 4.2 百分位数
  • 4.3 CDF
  • 4.4 表示CDF
  • 4.5 比较CDF
  • 4.6 基于百分位数的统计量
  • 4.7 随机数
  • 4.8 比较百分位秩
  • 4.9 练习
  • 4.10 术语
  • 第5章 分布建模
  • 5.1 指数分布
  • 5.2 正态分布
  • 5.3 正态概率图
  • 5.4 对数正态分布
  • 5.5 Pareto分布
  • 5.6 随机数生成
  • 5.7 为什么使用模型
  • 5.8 练习
  • 5.9 术语
  • 第6章 概率密度函数
  • 6.1 PDF
  • 6.2 核密度估计
  • 6.3 分布框架
  • 6.4 Hist实现
  • 6.5 Pmf实现
  • 6.6 Cdf实现
  • 6.7 矩
  • 6.8 偏度
  • 6.9 练习
  • 6.10 术语
  • 第7章 变量之间的关系
  • 7.1 散点图
  • 7.2 描述关系特征
  • 7.3 相关性
  • 7.4 协方差
  • 7.5 Pearson相关性
  • 7.6 非线性关系
  • 7.7 Spearman秩相关
  • 7.8 相关性和因果关系
  • 7.9 练习
  • 7.10 术语
  • 第8章 估计
  • 8.1 估计游戏
  • 8.2 猜测方差
  • 8.3 抽样分布
  • 8.4 抽样偏倚
  • 8.5 指数分布
  • 8.6 练习
  • 8.7 术语
  • 第9章 假设检验
  • 9.1 经典假设检验
  • 9.2 假设检验
  • 9.3 检验均值差
  • 9.4 其他检验统计量
  • 9.5 检验相关性
  • 9.6 检验比例
  • 9.7 卡方检验
  • 9.8 再谈第一胎
  • 9.9 误差
  • 9.10 功效
  • 9.11 复现
  • 9.12 练习
  • 9.13 术语
  • 第10章 线性最小二乘法
  • 10.1 最小二乘法拟合
  • 10.2 实现
  • 10.3 残差
  • 10.4 估计
  • 10.5 拟合优度
  • 10.6 检验线性模型
  • 10.7 加权重抽样
  • 10.8 练习
  • 10.9 术语
  • 第11章 回归
  • 11.1 StatsModels
  • 11.2 多重回归
  • 11.3 非线性关系
  • 11.4 数据挖掘
  • 11.5 预测
  • 11.6 Logistic回归
  • 11.7 估计参数
  • 11.8 实现
  • 11.9 准确度
  • 11.10 练习
  • 11.11 术语
  • 第12章 时间序列分析
  • 12.1 导入和清洗数据
  • 12.2 绘制图形
  • 12.3 线性回归
  • 12.4 移动平均值
  • 12.5 缺失值
  • 12.6 序列相关
  • 12.7 自相关
  • 12.8 预测
  • 12.9 参考书目
  • 12.10 练习
  • 12.11 术语
  • 第13章 生存分析
  • 13.1 生存曲线
  • 13.2 危险函数
  • 13.3 估计生存曲线
  • 13.4 Kaplan-Meier估计
  • 13.5 婚姻曲线
  • 13.6 估计生存函数
  • 13.7 置信区间
  • 13.8 群组效应
  • 13.9 外推
  • 13.10 预期剩余生存期
  • 13.11 练习
  • 13.12 术语
  • 第14章 分析方法
  • 14.1 正态分布
  • 14.2 抽样分布
  • 14.3 表示正态分布
  • 14.4 中心极限定理
  • 14.5 检验CLT
  • 14.6 应用CLT
  • 14.7 相关检验
  • 14.8 卡方检验
  • 14.9 讨论
  • 14.10 练习
  • 作者介绍
  • 封面介绍
  • 看完了
展开全部

评分及书评

评分不足
2个评分
  • 用户头像
    给这本书评了
    4.0
    统计学入门教材

    建议阅读对象是理科非数理专业, 行为浅但写的很细致。结合了 Python 代码,我想一些程序员如果需要提升概率与统计的素养也可以尝试速读。


    顺着这几个线索:
    分布是什么在? 离散分布与连续分布怎么描述?
    随机变量、统计量又是什么,样本和总体有什么关系? 结合正态分布给出一个具体的理解: 从地球人类中抽取了一百万个人,与随机抽取一百人的出来的结论有什么区别?
    方差到底有什么用处?
    最小二乘 均方误差 线性回归 看到这几个词 你会想到什么呢?

    下午一边写代码一边看这本书 不知不觉就看完了~
    推荐一下

      2
      评论

    出版方

    人民邮电出版社·图灵出品

    图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。