数理科学与化学
类型
7.5
豆瓣评分
可以朗读
语音朗读
213千字
字数
2018-05-01
发行日期
展开全部
主编推荐语
数学、编程、商业分析结合,助您探究数据科学问题。
内容简介
本书可以帮助读者把数学、编程和商业分析联系起来。通过学习这本书,读者有信心探究和解答复杂的数据科学问题,从抽象的原始的统计,发掘出切实可行的观点和想法。本书适合缺乏数学知识的编程人员,或者是拥有数学技能、想投身数据科学领域的人士阅读使用。
目录
- 版权信息
- 版权声明
- 内容提要
- 关于作者
- 译者简介
- 中文版审校人
- 英文版审稿人
- 前言
- 本书涵盖的内容
- 你需要做的准备工作
- 本书面向的读者
- 约定
- 资源与支持
- 配套资源
- 提交勘误
- 与我们联系
- 关于异步社区和异步图书
- 第1章 如何听起来像数据科学家
- 1.1 什么是数据科学
- 1.1.1 基本的专业术语
- 1.1.2 为什么是数据科学
- 1.1.3 案例:西格玛科技公司
- 1.2 数据科学韦恩图
- 1.2.1 数学
- 1.2.2 计算机编程
- 1.2.3 为什么是Python
- 1.2.4 领域知识
- 1.3 更多的专业术语
- 1.4 数据科学案例
- 1.4.1 案例:自动审核政府文件
- 1.4.2 案例:市场营销费用
- 1.4.3 案例:数据科学家的岗位描述
- 1.5 总结
- 第2章 数据的类型
- 2.1 数据的“味道”
- 2.2 为什么要进行区分
- 2.3 结构化数据和非结构化数据
- 案例:数据预处理
- 2.4 定量数据和定性数据
- 2.4.1 案例:咖啡店数据
- 2.4.2 案例:世界酒精消费量
- 2.4.3 更深入的研究
- 2.5 简单小结
- 2.6 数据的4个尺度
- 2.6.1 定类尺度
- 2.6.2 定序尺度
- 2.6.3 定距尺度
- 2.6.4 定比尺度
- 2.7 数据是旁观者的眼睛
- 2.8 总结
- 第3章 数据科学的5个步骤
- 3.1 数据科学简介
- 3.2 5个步骤概览
- 3.2.1 提出有意思的问题
- 3.2.2 获取数据
- 3.2.3 探索数据
- 3.2.4 数据建模
- 3.2.5 可视化和分享结果
- 3.3 探索数据
- 3.3.1 数据探索的基本问题
- 3.3.2 数据集1:Yelp点评数据
- 3.3.3 数据集2:泰坦尼克
- 3.4 总结
- 第4章 基本的数学知识
- 4.1 数学学科
- 4.2 基本的数学符号和术语
- 4.2.1 向量和矩阵
- 4.2.2 算术符号
- 4.2.3 图表
- 4.2.4 指数/对数
- 4.2.5 集合论
- 4.3 线性代数
- 矩阵乘积
- 4.4 总结
- 第5章 概率论入门:不可能,还是不太可能
- 5.1 基本的定义
- 5.2 概率
- 5.3 贝叶斯VS频率论
- 频率论方法
- 5.4 复合事件
- 5.5 条件概率
- 5.6 概率定理
- 5.6.1 加法定理
- 5.6.2 互斥性
- 5.6.3 乘法定理
- 5.6.4 独立性
- 5.6.5 互补事件
- 5.7 再进一步
- 5.8 总结
- 第6章 高等概率论
- 6.1 互补事件
- 6.2 重温贝叶斯思想
- 6.2.1 贝叶斯定理
- 6.2.2 贝叶斯定理的更多应用
- 6.3 随机变量
- 6.3.1 离散型随机变量
- 6.3.2 连续型随机变量
- 6.4 总结
- 第7章 统计学入门
- 7.1 什么是统计学
- 7.2 如何获取数据
- 获取数据
- 7.3 数据抽样
- 7.3.1 概率抽样
- 7.3.2 随机抽样
- 7.3.3 不等概率抽样
- 7.4 如何描述统计量
- 7.4.1 测度中心
- 7.4.2 变异测度
- 7.4.3 变异系数
- 7.4.4 相对位置测度
- 7.5 经验法则
- 7.6 总结
- 第8章 高等统计学
- 8.1 点估计
- 8.2 抽样分布
- 8.3 置信区间
- 8.4 假设检验
- 8.4.1 实施假设检验
- 8.4.2 单样本t检验
- 8.4.3 I型错误和II型错误
- 8.4.4 分类变量的假设检验
- 8.5 总结
- 第9章 交流数据
- 9.1 为什么交流数据很重要
- 9.2 识别有效和无效的可视化
- 9.2.1 散点图
- 9.2.2 折线图
- 9.2.3 条形图
- 9.2.4 直方图
- 9.2.5 箱形图
- 9.3 当图表和统计在说谎
- 9.3.1 相关性VS因果关系
- 9.3.2 辛普森悖论
- 9.3.3 如果相关性不等于因果关系,那什么导致了因果关系
- 9.4 语言交流
- 9.4.1 关键在于讲故事
- 9.4.2 正式场合的注意事项
- 9.5 为什么演示、如何演示和演示策略
- 9.6 总结
- 第10章 机器学习精要:你的烤箱在学习吗
- 10.1 什么是机器学习
- 10.2 机器学习并不完美
- 10.3 机器学习如何工作
- 10.4 机器学习的分类
- 10.4.1 监督学习
- 10.4.2 无监督学习
- 10.4.3 强化学习
- 10.5 统计模型如何纳入以上分类
- 10.6 线性回归
- 10.6.1 增加更多预测因子
- 10.6.2 回归指标
- 10.7 Logistic回归
- 10.8 概率、几率和对数几率
- Logistic回归的数学原理
- 10.9 哑变量
- 10.10 总结
- 第11章 树上无预言,真的吗
- 11.1 朴素贝叶斯分类
- 11.2 决策树
- 11.2.1 计算机如何生成回归树
- 11.2.2 计算机如何拟合分类树
- 11.3 无监督学习
- 11.3.1 无监督学习的使用场景
- 11.3.2 K均值聚类
- 11.3.3 如何选择最佳的K值,并对簇进行评价
- 11.4 特征提取和主成分分析
- 11.5 总结
- 第12章 超越精要
- 12.1 偏差-方差权衡
- 12.1.1 偏差导致的误差
- 12.1.2 方差导致的误差
- 12.1.3 两种极端的偏差-方差权衡情况
- 12.1.4 偏差-方差如何组成误差函数
- 12.2 K层交叉验证
- 12.3 网格搜索算法
- 可视化训练误差和交叉验证误差
- 12.4 集成技术
- 12.4.1 随机森林
- 12.4.2 随机森林VS决策树
- 12.5 神经网络
- 神经网络的基本结构
- 12.6 总结
- 第13章 案例
- 13.1 案例1:基于社交媒体预测股票价格
- 13.1.1 文本情感分析
- 13.1.2 探索性数据分析
- 13.1.3 超越案例
- 13.2 案例2:为什么有些人会对配偶撒谎
- 13.3 案例3:初试TensorFlow
- 13.4 总结
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。