《PySpark大数据分析与应用》电子书在线阅读-戴刚主编；张良均主编；桂友武副主编；李晓英副主编；李晓丹副主编-得到APP

互联网类型

可以朗读语音朗读

144千字字数

2024-04-01 发行日期

展开全部

主编推荐语

系统介绍pypark开发环境搭建及大数据分析。

内容简介

本书以python作为开发语言，系统介绍pypark开发环境搭建流程及基于pypark进行大数据分析的相关知识。本书条理清晰、重点突出，理论叙述循序渐进、由浅入深。

本书共7章，第1～5章包括pypark大数据分析概述、pypark安装配置、基于pypark的dataframe作、基于pypark的流式数据处理、基于pypark的机器学库，内容介绍注重理论与实践相结合，通过典型示例强化pypark在大数据分析中的实际应用；

第6、7章通过基于pypark的网络招聘信息的职业类型划分和基于pypark的信用贷款风险分析两个完整的案例实战，结合前5章的pypark编程知识，实现完整的大数据分析过程。

本书大部分章包含实训和课后题，读者通过练和作实践，能够巩固所学的内容。

评分及书评

尚无评分

目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社，成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”，致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。