互联网
类型
可以朗读
语音朗读
126千字
字数
2020-01-01
发行日期
展开全部
主编推荐语
论述支持大数据分析的关联规则并行挖掘算法与集群系统性能优化,探讨其在智能制造领域的应用。
内容简介
大数据推动了各行各业的迅猛发展,各领域呈现出新产品、新技术、新服务和新的发展业态,但“信息丰富而知识贫乏”的现象仍然存在。逾越数据与知识之间的鸿沟,需要强有力的分析工具和分析方法的支撑。现有的关联规则挖掘算法,因其时空复杂性和I/O代价高,难以适应大数据分析任务。
本书充分利用Hadoop、Spark等集群系统的强大数据处理能力,论述了支持大数据分析的关联规则并行挖掘算法与集群系统性能优化,并探讨了其在智能制造领域的应用。本书可供从事数据挖掘、机器学习及并行计算等相关专业的科研人员参考,也可作为高等院校计算机、大数据专业的高年级本科生与研究生的学习参考书。
目录
- 版权信息
- 内容简介
- 前言
- 第一篇 基础理论篇
- 第1章 绪论
- 1.1 数据挖掘
- 1.2 关联规则
- 1.3 集群系统与并行计算模型
- 1.4 大数据环境下的数据挖掘及应用
- 第2章 MapReduce集群环境下的数据放置策略
- 2.1 引言
- 2.2 数据放置策略的关键问题与度量标准
- 2.3 数据放置策略的优化
- 2.4 数据放置策略的分析与归纳
- 2.5 本章小结
- 第二篇 关联规则并行挖掘及性能优化篇
- 第3章 压缩后缀链表与并行频繁项集挖掘算法
- 3.1 问题提出
- 3.2 基础理论
- 3.3 基于MapReduce的频繁项集挖掘算法
- 3.4 实验评价
- 3.5 本章小结
- 第4章 FIUT算法与频繁项集并行挖掘
- 4.1 引言
- 4.2 FIUT算法描述
- 4.3 FiDoop算法概述
- 4.4 基于MapReduce的FiDoop算法
- 4.5 实现细节
- 4.6 FiDoop-HD算法
- 4.7 实验评价
- 4.8 本章小结
- 第5章 MapReduce编程模型下的约束频繁项集并行挖掘算法
- 5.1 问题提出
- 5.2 约束频繁项集挖掘算法的并行化
- 5.3 基于MapReduce的约束频繁项集并行挖掘
- 5.4 基于MapReduce的约束频繁项集并行挖掘算法(PACFP)
- 5.5 负载均衡
- 5.6 实验结果及分析
- 5.7 本章小结
- 第6章 支持并行频繁项集挖掘的数据划分策略
- 6.1 引言
- 6.2 并行FP-Growth算法
- 6.3 相关工作
- 6.4 问题陈述和设计目标
- 6.5 数据划分策略
- 6.6 实现细节
- 6.7 实验评价
- 6.8 本章小结
- 第7章 频繁项集并行化过程中的重定向任务调度
- 7.1 问题提出
- 7.2 重定向任务调度算法
- 7.3 实验结果及分析
- 7.4 本章小结
- 第8章 基于Spark内存计算的并行频繁项集挖掘及优化
- 8.1 引言
- 8.2 FP-Growth 算法的并行化分析
- 8.3 Spark环境下的均衡FP-Growth算法
- 8.4 实验评价
- 8.5 本章小结
- 第三篇 应用篇
- 第9章 冷轧辊加工质量管理过程相关性分析
- 9.1 引言
- 9.2 系统需求与总体设计
- 9.3 数据预处理及关键技术
- 9.4 提取关联规则
- 9.5 系统实现及运行结果
- 9.6 本章小结
- 附录A 冷轧辊加工数据
- 附录B 冷轧辊加工数据预处理格式
- 参考文献
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。