展开全部

主编推荐语

本书包含数据分析实例,涵盖从基础统计学到ETL、深度学习和物联网的广泛领域,给出了分析项目技术方面的概念。

内容简介

本书介绍高级数据分析概念的广泛基础,以及最近的数据库革命,如Neo4j、弹性搜索和MongoDB。本书讨论了如何实现包括局部爬取在内的ETL技术,并应用于高频算法交易和目标导向的对话系统等领域。还有一些机器学习概念的例子,如半监督学习、深度学习和NLP。本书还涵盖了重要的传统数据分析技术,如时间序列和主成分分析等。

目录

  • 版权信息
  • 译者序
  • 作者简介
  • 技术审核员简介
  • 致谢
  • 第1章 简介
  • 1.1 为何选择Python
  • 1.2 何时避免使用Python
  • 1.3 Python中的面向对象编程
  • 1.4 在Python中调用其他语言
  • 1.5 将Python模型作为微服务
  • 1.6 高性能API和并发编程
  • 第2章 Python结构化数据提取、转换和加载
  • 2.1 MySQL
  • 2.1.1 如何安装MySQLdb
  • 2.1.2 数据库连接
  • 2.1.3 INSERT操作
  • 2.1.4 READ操作
  • 2.1.5 DELETE操作
  • 2.1.6 UPDATE操作
  • 2.1.7 COMMIT操作
  • 2.1.8 ROLL-BACK操作
  • 2.2 Elasticsearch
  • 2.3 Neo4j Python驱动
  • 2.4 neo4j-rest-client
  • 2.5 内存数据库
  • 2.6 Python版本MongoDB
  • 2.6.1 将数据导入集合
  • 2.6.2 使用pymongo创建连接
  • 2.6.3 访问数据库对象
  • 2.6.4 插入数据
  • 2.6.5 更新数据
  • 2.6.6 删除数据
  • 2.7 Pandas
  • 2.8 Python非结构化数据提取、转换和加载
  • 2.8.1 电子邮件解析
  • 2.8.2 主题爬取
  • 第3章 基于Python的监督学习
  • 3.1 使用Python实现降维
  • 3.1.1 相关性分析
  • 3.1.2 主成分分析
  • 3.1.3 互信息
  • 3.2 使用Python进行分类
  • 3.3 半监督学习
  • 3.4 决策树
  • 3.4.1 哪个属性优先
  • 3.4.2 随机森林分类器
  • 3.5 朴素贝叶斯分类器
  • 3.6 支持向量机
  • 3.7 最近邻分类器
  • 3.8 情绪分析
  • 3.9 图像识别
  • 3.10 使用Python进行回归
  • 3.10.1 最小二乘估计
  • 3.10.2 逻辑回归
  • 3.11 分类和回归
  • 3.12 使模型高估或低估
  • 3.13 处理分类型数据
  • 第4章 无监督学习—聚类
  • 4.1 K均值聚类
  • 4.2 选择K—肘部法则
  • 4.3 距离或相似性度量
  • 4.3.1 属性
  • 4.3.2 一般及欧氏距离
  • 4.3.3 平方欧氏距离
  • 4.3.4 字符串之间的编辑距离
  • 4.4 文档上下文的相似性
  • 4.5 什么是层次聚类
  • 4.5.1 自下而上的方法
  • 4.5.2 聚类之间的距离
  • 4.5.3 自上而下的方法
  • 4.5.4 图论方法
  • 4.6 如何判断聚类结果是否良好
  • 第5章 深度学习和神经网络
  • 5.1 反向传播
  • 5.1.1 反向传播方法
  • 5.1.2 广义Delta规则
  • 5.1.3 输出层权重更新
  • 5.1.4 隐藏层权重更新
  • 5.1.5 反向传播网络小结
  • 5.2 反向传播算法
  • 5.3 其他算法
  • 5.4 TensorFlow
  • 5.5 递归神经网络
  • 第6章 时间序列
  • 6.1 变化的分类
  • 6.2 包含趋势的序列分析
  • 6.2.1 曲线拟合
  • 6.2.2 从时间序列中去除趋势
  • 6.3 包含周期性的序列数据分析
  • 6.4 从时间序列中去除周期性
  • 6.4.1 滤波
  • 6.4.2 差分
  • 6.5 转换
  • 6.5.1 稳定方差
  • 6.5.2 使周期效应累加
  • 6.5.3 使数据呈正态分布
  • 6.6 平稳时间序列
  • 6.6.1 平稳过程
  • 6.6.2 自相关和相关图
  • 6.6.3 自协方差和自相关函数的估计
  • 6.7 使用Python进行时间序列分析
  • 6.7.1 有用的方法
  • 6.7.2 自回归过程
  • 6.7.3 估计AR过程的参数
  • 6.8 混合ARMA模型
  • 6.9 集成ARMA模型
  • 6.10 傅里叶变换
  • 6.11 一个特殊的场景
  • 6.12 数据缺失
  • 第7章 大数据分析
  • 7.1 Hadoop
  • 7.1.1 MapReduce编程
  • 7.1.2 partitioning函数
  • 7.1.3 combiner函数
  • 7.1.4 HDFS文件系统
  • 7.1.5 MapReduce设计模式
  • 7.2 Spark
  • 7.3 云分析
  • 7.4 物联网
展开全部

评分及书评

评分不足
1个评分
  • 用户头像
    给这本书评了
    5.0

    作为当今社会的热门职位,数据科学家通过对大量数据的合理使用,引起了一大批新的应用甚至是新的行业的产生。作为数据科学家使用的方法和工具,数据分析技术通过对收集来的大量数据进行详细研究和概括总结,让数据开口说话,从数据中提取有用信息并形成相应的结论,最终帮助人们将数据转化为可以付诸行动的见解。

      转发
      评论

    出版方

    机械工业出版社

    机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。