展开全部

主编推荐语

深入浅出地介绍了ETL数据整合与处理的相关内容。

内容简介

本书以Kettle实现ETL流程为目标,将ETL知识点与任务相结合,配套真实案例。

全书共8章,第1章介绍了ETL概念和ETL工具,让读者在了解ETL相关的概念后,立刻上手ETL工具Kettle;第2~6章介绍了Kettle工具转换相关的组件,包括源数据获取、记录处理、字段处理、等内容,内容与ETL流程匹配,能帮助读者快速掌握ETL;第7章介绍了Kettle工具任务的相关组件,能够帮助读者串联不同的任务,以及实现调度的功能;第8章介绍了无人售货机ETL项目,通过项目案例的形式,帮助读者将所学知识融会贯通。

目录

  • 版权信息
  • 内容提要
  • 大数据专业系列图书专家委员会
  • 前言
  • 第1章 开启ETL之旅
  • 任务1.1 认识ETL
  • 1.1.1 了解ETL
  • 1.1.2 选择ETL工具
  • 任务1.2 配置Kettle运行环境
  • 1.2.1 安装JDK
  • 1.2.2 安装MySQL数据库
  • 1.2.3 配置Kettle
  • 任务1.3 熟悉Kettle基本操作
  • 1.3.1 认识Kettle界面
  • 1.3.2 新建转换与任务
  • 1.3.3 运行与查看结果面板
  • 小结
  • 课后习题
  • 第2章 源数据获取
  • 任务2.1 创建数据库连接
  • 2.1.1 建立数据库连接
  • 2.1.2 设置参数
  • 2.1.3 测试和浏览数据库连接结果
  • 2.1.4 建立/停止共享数据库连接
  • 任务2.2 表输入
  • 2.2.1 建立表输入转换工程
  • 2.2.2 设置参数
  • 2.2.3 预览结果数据
  • 任务2.3 CSV文件输入
  • 2.3.1 建立CSV文件输入转换工程
  • 2.3.2 设置参数
  • 2.3.3 预览结果数据
  • 任务2.4 Excel输入
  • 2.4.1 建立Excel输入转换工程
  • 2.4.2 设置参数
  • 2.4.3 预览结果数据
  • 任务2.5 生成记录
  • 2.5.1 建立生成记录转换工程
  • 2.5.2 设置参数
  • 2.5.3 预览结果数据
  • 任务2.6 生成随机数
  • 2.6.1 建立生成随机数转换工程
  • 2.6.2 设置参数
  • 2.6.3 预览结果数据
  • 任务2.7 获取系统信息
  • 2.7.1 建立获取系统信息转换工程
  • 2.7.2 设置参数
  • 2.7.3 预览结果数据
  • 小结
  • 课后习题
  • 第3章 记录处理
  • 任务3.1 排序记录
  • 3.1.1 建立排序记录转换工程
  • 3.1.2 设置参数
  • 3.1.3 预览结果数据
  • 任务3.2 去除重复记录
  • 3.2.1 建立去除重复记录转换工程
  • 3.2.2 设置参数
  • 3.2.3 预览结果数据
  • 任务3.3 替换NULL值
  • 3.3.1 建立替换NULL值转换工程
  • 3.3.2 设置参数
  • 3.3.3 预览结果数据
  • 任务3.4 过滤记录
  • 3.4.1 建立过滤记录转换工程
  • 3.4.2 设置参数
  • 3.4.3 预览结果数据
  • 任务3.5 值映射
  • 3.5.1 建立值映射转换工程
  • 3.5.2 设置参数
  • 3.5.3 预览结果数据
  • 任务3.6 字符串替换
  • 3.6.1 建立字符串替换转换工程
  • 3.6.2 设置参数
  • 3.6.3 预览结果数据
  • 任务3.7 字符串操作
  • 3.7.1 建立字符串操作转换工程
  • 3.7.2 设置参数
  • 3.7.3 预览结果数据
  • 任务3.8 分组
  • 3.8.1 建立分组转换工程
  • 3.8.2 设置参数
  • 3.8.3 预览结果数据
  • 小结
  • 课后习题
  • 第4章 字段处理
  • 任务4.1 字段选择
  • 4.1.1 建立字段选择转换工程
  • 4.1.2 设置参数
  • 4.1.3 预览结果数据
  • 任务4.2 增加常量
  • 4.2.1 建立增加常量转换工程
  • 4.2.2 设置参数
  • 4.2.3 预览结果数据
  • 任务4.3 将字段值设置为常量
  • 4.3.1 建立将字段值设置为常量转换工程
  • 4.3.2 设置参数
  • 4.3.3 预览结果数据
  • 任务4.4 剪切字符串
  • 4.4.1 建立剪切字符串转换工程
  • 4.4.2 设置参数
  • 4.4.3 预览结果数据
  • 任务4.5 拆分字段
  • 4.5.1 建立拆分字段转换工程
  • 4.5.2 设置参数
  • 4.5.3 预览结果数据
  • 任务4.6 数值范围
  • 4.6.1 建立数值范围转换工程
  • 4.6.2 设置参数
  • 4.6.3 预览结果数据
  • 任务4.7 计算器
  • 4.7.1 建立计算器转换工程
  • 4.7.2 设置参数
  • 任务4.8 增加序列
  • 4.8.1 建立增加序列转换工程
  • 4.8.2 设置参数
  • 4.8.3 预览结果数据
  • 小结
  • 课后习题
  • 第5章 高级转换
  • 任务5.1 记录集连接
  • 5.1.1 建立记录集连接转换工程
  • 5.1.2 设置参数
  • 5.1.3 预览结果数据
  • 任务5.2 多路数据合并连接
  • 5.2.1 建立多路数据合并连接转换工程
  • 5.2.2 设置参数
  • 5.2.3 预览结果数据
  • 任务5.3 单变量统计
  • 5.3.1 建立单变量统计转换工程
  • 5.3.2 设置参数
  • 5.3.3 预览结果数据
  • 任务5.4 公式
  • 5.4.1 建立公式转换工程
  • 5.4.2 设置参数
  • 5.4.3 预览结果数据
  • 任务5.5 利用Janino计算Java表达式
  • 5.5.1 建立利用Janino计算Java表达式转换工程
  • 5.5.2 设置参数
  • 5.5.3 预览结果数据
  • 任务5.6 JavaScript代码
  • 5.6.1 建立JavaScript代码转换工程
  • 5.6.2 设置参数
  • 5.6.3 预览结果数据
  • 任务5.7 设置变量
  • 5.7.1 建立设置变量转换工程
  • 5.7.2 设置参数
  • 5.7.3 预览结果数据
  • 任务5.8 获取变量
  • 5.8.1 建立获取变量转换工程
  • 5.8.2 设置参数
  • 5.8.3 预览结果数据
  • 小结
  • 课后习题
  • 第6章 迁移和装载
  • 任务6.1 表输出
  • 6.1.1 建立表输出转换工程
  • 6.1.2 设置参数
  • 6.1.3 预览结果数据
  • 任务6.2 插入/更新
  • 6.2.1 建立插入/更新转换工程
  • 6.2.2 设置参数
  • 6.2.3 预览结果数据
  • 任务6.3 Excel输出
  • 6.3.1 建立Excel输出转换工程
  • 6.3.2 设置参数
  • 6.3.3 预览结果数据
  • 任务6.4 文本文件输出
  • 6.4.1 建立文本文件输出转换工程
  • 6.4.2 设置参数
  • 6.4.3 预览结果数据
  • 任务6.5 SQL文件输出
  • 6.5.1 建立SQL文件输出转换工程
  • 6.5.2 设置参数
  • 6.5.3 预览结果数据
  • 小结
  • 课后习题
  • 第7章 任务
  • 任务7.1 开始
  • 7.1.1 建立开始任务工程
  • 7.1.2 设置参数
  • 7.1.3 运行任务
  • 任务7.2 转换
  • 7.2.1 建立转换任务工程
  • 7.2.2 设置参数
  • 7.2.3 运行任务
  • 任务7.3 添加文件到结果文件中
  • 7.3.1 建立添加文件到结果文件中任务工程
  • 7.3.2 设置参数
  • 7.3.3 运行任务
  • 任务7.4 发送邮件
  • 7.4.1 建立发送邮件任务工程
  • 7.4.2 设置参数
  • 7.4.3 运行任务
  • 任务7.5 成功
  • 7.5.1 建立成功任务
  • 7.5.2 设置参数
  • 7.5.3 运行任务
  • 任务7.6 检查表是否存在
  • 7.6.1 建立检查表是否存在任务工程
  • 7.6.2 设置参数
  • 7.6.3 运行任务
  • 任务7.7 SQL
  • 7.7.1 建立SQL任务工程
  • 7.7.2 设置参数
  • 7.7.3 运行任务
  • 任务7.8 检查列是否存在
  • 7.8.1 建立检查列是否存在任务工程
  • 7.8.2 设置参数
  • 7.8.3 运行任务
  • 任务7.9 检查一个文件是否存在
  • 7.9.1 建立检查一个文件是否存在任务工程
  • 7.9.2 设置参数
  • 7.9.3 运行任务
  • 任务7.10 检查多个文件是否存在
  • 7.10.1 建立检查多个文件是否存在任务工程
  • 7.10.2 设置参数
  • 7.10.3 运行任务
  • 小结
  • 课后习题
  • 第8章 无人售货机项目实战
  • 任务8.1 了解无人售货机项目背景与目标
  • 8.1.1 了解项目背景
  • 8.1.2 熟悉项目目标
  • 8.1.3 熟悉数据字段
  • 任务8.2 分组聚合客户订单
  • 8.2.1 分析任务数据需求
  • 8.2.2 熟悉任务流程
  • 8.2.3 实现聚合客户订单
  • 任务8.3 计算各商品销售金额
  • 8.3.1 分析任务数据需求
  • 8.3.2 熟悉任务流程
  • 8.3.3 实现各商品销售金额计算
  • 任务8.4 统计各售货机日销售金额
  • 8.4.1 分析任务数据需求
  • 8.4.2 熟悉任务流程
  • 8.4.3 实现各售货机销售金额统计
  • 任务8.5 整理各售货机销售情况
  • 8.5.1 分析任务数据需求
  • 8.5.2 熟悉任务流程
  • 8.5.3 实现各售货机销售情况整理
  • 小结
  • 课后习题
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。