互联网
类型
可以朗读
语音朗读
92千字
字数
2019-01-01
发行日期
展开全部
主编推荐语
本书包含数据分析实例,涵盖从基础统计学到ETL、深度学习和物联网的广泛领域,给出了分析项目技术方面的概念。
内容简介
本书介绍高级数据分析概念的广泛基础,以及最近的数据库革命,如Neo4j、弹性搜索和MongoDB。本书讨论了如何实现包括局部爬取在内的ETL技术,并应用于高频算法交易和目标导向的对话系统等领域。还有一些机器学习概念的例子,如半监督学习、深度学习和NLP。本书还涵盖了重要的传统数据分析技术,如时间序列和主成分分析等。
目录
- 版权信息
- 译者序
- 作者简介
- 技术审核员简介
- 致谢
- 第1章 简介
- 1.1 为何选择Python
- 1.2 何时避免使用Python
- 1.3 Python中的面向对象编程
- 1.4 在Python中调用其他语言
- 1.5 将Python模型作为微服务
- 1.6 高性能API和并发编程
- 第2章 Python结构化数据提取、转换和加载
- 2.1 MySQL
- 2.1.1 如何安装MySQLdb
- 2.1.2 数据库连接
- 2.1.3 INSERT操作
- 2.1.4 READ操作
- 2.1.5 DELETE操作
- 2.1.6 UPDATE操作
- 2.1.7 COMMIT操作
- 2.1.8 ROLL-BACK操作
- 2.2 Elasticsearch
- 2.3 Neo4j Python驱动
- 2.4 neo4j-rest-client
- 2.5 内存数据库
- 2.6 Python版本MongoDB
- 2.6.1 将数据导入集合
- 2.6.2 使用pymongo创建连接
- 2.6.3 访问数据库对象
- 2.6.4 插入数据
- 2.6.5 更新数据
- 2.6.6 删除数据
- 2.7 Pandas
- 2.8 Python非结构化数据提取、转换和加载
- 2.8.1 电子邮件解析
- 2.8.2 主题爬取
- 第3章 基于Python的监督学习
- 3.1 使用Python实现降维
- 3.1.1 相关性分析
- 3.1.2 主成分分析
- 3.1.3 互信息
- 3.2 使用Python进行分类
- 3.3 半监督学习
- 3.4 决策树
- 3.4.1 哪个属性优先
- 3.4.2 随机森林分类器
- 3.5 朴素贝叶斯分类器
- 3.6 支持向量机
- 3.7 最近邻分类器
- 3.8 情绪分析
- 3.9 图像识别
- 3.10 使用Python进行回归
- 3.10.1 最小二乘估计
- 3.10.2 逻辑回归
- 3.11 分类和回归
- 3.12 使模型高估或低估
- 3.13 处理分类型数据
- 第4章 无监督学习—聚类
- 4.1 K均值聚类
- 4.2 选择K—肘部法则
- 4.3 距离或相似性度量
- 4.3.1 属性
- 4.3.2 一般及欧氏距离
- 4.3.3 平方欧氏距离
- 4.3.4 字符串之间的编辑距离
- 4.4 文档上下文的相似性
- 4.5 什么是层次聚类
- 4.5.1 自下而上的方法
- 4.5.2 聚类之间的距离
- 4.5.3 自上而下的方法
- 4.5.4 图论方法
- 4.6 如何判断聚类结果是否良好
- 第5章 深度学习和神经网络
- 5.1 反向传播
- 5.1.1 反向传播方法
- 5.1.2 广义Delta规则
- 5.1.3 输出层权重更新
- 5.1.4 隐藏层权重更新
- 5.1.5 反向传播网络小结
- 5.2 反向传播算法
- 5.3 其他算法
- 5.4 TensorFlow
- 5.5 递归神经网络
- 第6章 时间序列
- 6.1 变化的分类
- 6.2 包含趋势的序列分析
- 6.2.1 曲线拟合
- 6.2.2 从时间序列中去除趋势
- 6.3 包含周期性的序列数据分析
- 6.4 从时间序列中去除周期性
- 6.4.1 滤波
- 6.4.2 差分
- 6.5 转换
- 6.5.1 稳定方差
- 6.5.2 使周期效应累加
- 6.5.3 使数据呈正态分布
- 6.6 平稳时间序列
- 6.6.1 平稳过程
- 6.6.2 自相关和相关图
- 6.6.3 自协方差和自相关函数的估计
- 6.7 使用Python进行时间序列分析
- 6.7.1 有用的方法
- 6.7.2 自回归过程
- 6.7.3 估计AR过程的参数
- 6.8 混合ARMA模型
- 6.9 集成ARMA模型
- 6.10 傅里叶变换
- 6.11 一个特殊的场景
- 6.12 数据缺失
- 第7章 大数据分析
- 7.1 Hadoop
- 7.1.1 MapReduce编程
- 7.1.2 partitioning函数
- 7.1.3 combiner函数
- 7.1.4 HDFS文件系统
- 7.1.5 MapReduce设计模式
- 7.2 Spark
- 7.3 云分析
- 7.4 物联网
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。