《Python数据分析与大数据处理从入门到精通》电子书在线阅读-朱春旭编著-得到APP

计算机类型

可以朗读语音朗读

188千字字数

2019-11-01 发行日期

展开全部

主编推荐语

本书主要讲解数据分析与大数据处理所需的技术、基础设施、核心概念、实施流程。

内容简介

本书从编程语言准备、数据采集与清洗、数据分析与可视化，到大型数据的分布式存储与分布式计算，贯穿了整个大数据项目开发流程。本书轻理论、重实践，目的是让读者快速上手。

第1篇首先介绍了Python的基本语法、面向对象开发、模块化设计等，掌握Python的编程方式。然后介绍了多线程、多进程及其相互间的通信，让读者对分布式程序有个基本的认识。第2篇介绍了网络数据采集、数据清洗、数据存储等技术。第3篇介绍了Python常用的数据分析工具，扩展了更多的数据清洗、插值方法，为最终的数据可视化奠定基础。第4篇是大数据分析的重点。首先介绍了Hadoop的框架原理、调度原理，MapReduce原理与编程模型、环境搭建，接着介绍了Spark框架原理、环境搭建方式，以及如何与Hive等第三方工具进行交互，还介绍了新的结构化流式处理技术。第5篇通过三个项目实例，综合介绍了如何分析网页、如何搭建分布式爬虫、如何应对常见的反爬虫、如何设计数据模型、如何设计架构模型、如何在实践中综合运用前四篇涉及的技术。本书既适合非计算机专业的编程“小白”，也适合刚毕业或即将毕业走向工作岗位的广大毕业生，以及已经有编程经验，但想转行做大数据分析的专业人士。同时，还可以作为广大职业院校、电脑培训班的教学参考用书。

评分及书评

尚无评分

目前还没人评分

出版方

北京大学出版社

北京大学出版社是在1979年，经国家出版事业管理局同意，教育部批准成立的，恢复了北京大学出版社建制。北京大学出版社依靠北大雄厚的教学、科研力量，同时积极争取国内外专家学者的合作支持，出版了大量高水平、高质量、适应多层次需要的优秀高等教育教材。北大出版社注意对教材进行全面追踪，捕捉信息，及时修订，以跟上各学科的最新发展，反映该学科研究的最新成果，保持北大版教材的领先地位。