计算机
类型
可以朗读
语音朗读
103千字
字数
2018-01-01
发行日期
展开全部
主编推荐语
大数据时代入门教程:分享数据探索经历,分3部分全面剖析数据挖掘与应用。
内容简介
伴随着大数据时代的发展,数据价值的挖掘以及产品化逐渐被重视起来。本书作为该领域的入门教程,打破以往的数据工具与技术的介绍,凭借作者在大数据价值探索的所感所悟,以故事的形式和读者分享一个又一个的数据经历,引人深思,耐人寻味。全书共10章,大致分为3个部分:第1部分(第1~3章)介绍数据情怀与数据入门;第2部分(第4~7章)讨论大数据挖掘相关的一系列学习体系;第3部分(第8~10章)为实践应用与数据产品的介绍,让所有学习大数据挖掘的朋友清楚如何落地,以及在整个数据生态圈所扮演的角色性,全面了解数据的上下游。
目录
- 封面
- 版权页
- 前言
- 目录
- 第1章 数据情怀篇
- 1.1 数据之禅
- 1.2 数据情怀
- 1.2.1 数据情怀这股劲
- 1.2.2 对数据情怀的理解
- 1.3 大数据时代的我们
- 1.4 成为DT时代的先驱者
- 1.4.1 数据没有寒冬
- 1.4.2 数据生态问题
- 1.4.3 健康的数据生态
- 1.4.4 结尾
- 第2章 数据入门
- 2.1 快速掌握SQL的基础语法
- 2.1.1 初识SQL
- 2.1.2 学会部署环境
- 2.1.3 常用的SQL语法(上篇)
- 2.1.4 常用的SQL语法(下篇)
- 2.2 在Windows 7操作系统上搭建IPython Notebook
- 2.2.1 学习Python的初衷
- 2.2.2 搭建IPython Notebook
- 2.2.3 IPython.exe Notebook的使用说明
- 2.2.4 配置IPython Notebook远程调用
- 2.3 快速掌握Python的基本语法
- 2.4 用Python搭建数据分析体系
- 2.4.1 构建的初衷
- 2.4.2 构建思路
- 2.4.3 开发流程
- 2.5 Python学习总结
- 2.5.1 关于Python
- 2.5.2 Python其他知识点
- 第3章 大数据工具篇
- 3.1 Hadoop伪分布式的安装配置
- 3.1.1 部署CentOS环境
- 3.1.2 部署Java环境
- 3.1.3 部署Hadoop伪分布式环境
- 3.2 数据挖掘中的MapReduce编程
- 3.2.1 学习MapReduce编程的目的
- 3.2.2 MapReduce的代码规范
- 3.2.3 简单的案例
- 3.3 利用MapReduce中的矩阵相乘
- 3.3.1 矩阵的概念
- 3.3.2 不同场景下的矩阵相乘
- 3.4 数据挖掘中的Hive技巧
- 3.4.1 面试心得
- 3.4.2 用Python执行HQL命令
- 3.4.3 必知的HQL知识
- 3.5 数据挖掘中的HBase技巧
- 3.5.1 知晓相关依赖包
- 3.5.2 从HBase中获取数据
- 3.5.3 往HBase中存储数据
- 第4章 大数据挖掘基础篇
- 4.1 MapReduce和Spark做大数据挖掘的差异
- 4.1.1 初识Hadoop生态系统
- 4.1.2 知晓Spark的特点
- 4.1.3 编程的差异性
- 4.1.4 它们之间的灵活转换
- 4.1.5 选择合适的工具
- 4.2 搭建大数据挖掘开发环境
- 4.3 动手实现算法工程
- 4.3.1 知晓Spark On Yarn的运作模式
- 4.3.2 创作第一个数据挖掘算法
- 4.3.3 如何理解“朴素”二字
- 4.3.4 如何动手实现朴素贝叶斯算法
- 第5章 大数据挖掘认知篇
- 5.1 理论与实践的差异
- 5.2 数据挖掘中的数据清洗
- 5.2.1 数据清洗的那些事
- 5.2.2 大数据的必杀技
- 5.2.3 实践中的数据清洗
- 5.3 数据挖掘中的工具包
- 5.3.1 业务模型是何物
- 5.3.2 想做一个好的模型
- 第6章 大数据挖掘算法篇
- 6.1 时间衰变算法
- 6.1.1 何为时间衰变
- 6.1.2 如何理解兴趣和偏好
- 6.1.3 时间衰变算法的抽象
- 6.1.4 采用Spark实现模型
- 6.2 熵值法
- 6.2.1 何为信息熵
- 6.2.2 熵值法的实现过程
- 6.2.3 业务场景的介绍
- 6.2.4 算法逻辑的抽象
- 6.3 预测响应算法
- 6.3.1 业务场景的介绍
- 6.3.2 构建模型的前期工作
- 6.3.3 常用的预测模型
- 6.4 层次分析算法
- 6.5 工程能力的培养与实践
- 6.5.1 工程能力的重要性
- 6.5.2 利用Python实现层次分析法
- 第7章 用户画像实践
- 7.1 用户画像的应用场景
- 7.1.1 背景描述
- 7.1.2 需求调研
- 7.2 用户画像的标签体系
- 7.2.1 需求分析
- 7.2.2 标签的构建
- 7.3 用户画像的模块化思维
- 7.3.1 何为模块化思维
- 7.3.2 用户画像与模块化思维
- 7.4 用户画像的工程开发
- 7.4.1 对于开发框架的选择
- 7.4.2 模块化功能的设计
- 7.5 用户画像的智能营销
- 7.5.1 业务营销
- 7.5.2 营销构思
- 7.5.3 技术难点
- 第8章 反欺诈实践篇
- 8.1 “羊毛党”监控的业务
- 8.1.1 “羊毛党”的定义与特点
- 8.1.2 “羊毛”存在的必然性
- 8.1.3 “羊毛党”的进化
- 8.1.4 “羊毛党”存在的利与弊
- 8.1.5 “羊毛党”监控平台的意义
- 8.2 “羊毛党”监控的设备指纹
- 8.2.1 何为设备指纹
- 8.2.2 底层参数
- 8.2.3 应用场景
- 8.2.4 移动端的数据持久化
- 8.2.5 设备指纹生成算法
- 8.3 “羊毛党”监控的数据驱动
- 8.3.1 监控的目的
- 8.3.2 数据如何“食用”
- 8.4 “羊毛党”监控的实践分享
- 第9章 大数据挖掘践行篇
- 9.1 如何从0到1转型到大数据圈子
- 9.2 数据挖掘从业者综合能力评估
- 9.2.1 度量的初衷
- 9.2.2 综合能力评估
- 9.2.3 个人指标体系(大数据挖掘)
- 9.3 给想要进入数据挖掘圈子的新人一点建议
- 9.3.1 诚信与包装
- 9.3.2 筹备能力
- 9.3.3 投好简历
- 9.3.4 把握面试
- 9.3.5 结尾
- 后记 数据价值探索与数据产品实践
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。