计算机
类型
可以朗读
语音朗读
460千字
字数
2018-10-01
发行日期
展开全部
主编推荐语
注重原理思想的数据挖掘实用指南。
内容简介
本书注重原理和思想,不过多纠缠技术细节,尽量简化数学公式和模型, 强调其背后的基本思想和出发点。 以实际的应用案例来贯穿始终,通过数据挖掘应用的实例来介绍如何应用和学习数据挖掘技术。主要包括几方面内容:数据挖掘的数学基础、计算机系统日志挖掘、下一代智能推荐系统、文本推荐、灾难信息管理、数据挖掘和信息安全、云数据和服务数据分析、社交媒体分析、高端智能制造。
目录
- 封面
- 扉页
- 版权信息
- 目录
- 内容提要
- 《国之重器出版工程》编辑委员会
- 《学术中国·大数据》丛书编辑委员会
- 丛书总序
- 前言
- 第1章 数据挖掘简介
- 1.1 大数据时代的数据挖掘
- 1.1.1 大数据的特点“4V+4V”
- 1.1.2 数据挖掘
- 1.1.3 从数据挖掘应用的角度看大数据
- 1.2 数据挖掘技术的发展历史
- 1.3 十大数据挖掘算法简介
- 1.4 数据挖掘平台:FIU-Miner
- 1.4.1 FIU-Miner平台简介
- 1.4.2 FIU-Miner系统架构
- 1.4.3 FIU-Miner应用实例
- 参考文献
- 第2章 系统日志和事件的挖掘
- 2.1 数据驱动的网络运维
- 2.1.1 网络运维1.0阶段:简单数据处理
- 2.1.2 网络运维2.0阶段:分布式大数据处理框架
- 2.1.3 网络运维3.0阶段:网络运维平台套件
- 2.1.4 网络运维4.0阶段:智能化网络运维
- 2.2 系统日志分析的目的
- 2.2.1 系统问题诊断
- 2.2.2 调试与优化
- 2.2.3 系统安全维护
- 2.3 日志数据分析管理系统的架构
- 2.3.1 日志数据的收集和预处理
- 2.3.2 历史日志数据存储
- 2.3.3 日志事件数据的分析以及对分析结果的展示和使用
- 2.4 系统日志的数据形式
- 2.4.1 无结构的日志数据
- 2.4.2 结构化与半结构化的日志数据
- 2.4.3 非结构化数据的转换
- 2.5 基于日志数据的异常检测
- 2.5.1 基于监督学习的异常检测
- 2.5.2 基于无监督学习的异常检测
- 2.6 系统故障根源跟踪
- 2.6.1 日志事件的依赖性挖掘
- 2.6.2 基于依赖关系的系统故障追踪
- 2.7 日志事件总结
- 2.7.1 事件总结算法基本要求及相关工作
- 2.7.2 基于事件发生频率变迁描述的事件总结
- 2.7.3 基于马尔可夫模型描述的事件总结
- 2.7.4 基于事件关系网络描述的事件总结
- 参考文献
- 第3章 工作票数据挖掘
- 3.1 工作票简介
- 3.2 工作票产生机制和亟待解决的问题
- 3.3 研究现状
- 3.3.1 工作票分类
- 3.3.2 工作票推荐
- 3.3.3 整体解决方案和工具
- 3.4 工作票漏报和误报检测
- 3.4.1 漏报和误报
- 3.4.2 基于规则的误报识别方法
- 3.4.3 半监督的工作票漏报发现方法
- 3.4.4 评价
- 3.5 层次多标签工作票分类
- 3.5.1 问题描述
- 3.5.2 层次损失函数和期望损失最小化
- 3.5.3 算法和解决方案
- 3.5.4 实验
- 3.6 工作票解决方案推荐
- 3.6.1 背景
- 3.6.2 基于KNN的推荐方法
- 3.6.3 划分方法
- 3.6.4 概率融合方法
- 3.6.5 度量学习方法
- 3.6.6 实验
- 参考文献
- 第4章 大数据与计算可持续性研究
- 4.1 大数据与可持续发展
- 4.1.1 可持续发展
- 4.1.2 大数据时代可持续发展面临的机遇和挑战
- 4.2 计算可持续性
- 4.2.1 计算可持续性数据及其特征
- 4.2.2 大数据环境下计算可持续性研究现状
- 4.3 研究案例
- 4.3.1 基于数据驱动的气象分析
- 4.3.2 基于数据驱动的建筑能耗分析
- 参考文献
- 第5章 推荐系统
- 5.1 个性化推荐系统概述
- 5.2 推荐技术
- 5.2.1 基于内容的推荐系统
- 5.2.2 基于协同过滤的推荐系统
- 5.2.3 基于知识的推荐系统
- 5.2.4 基于混合技术的推荐系统
- 5.2.5 基于计算智能的推荐系统
- 5.2.6 基于社交网络的推荐系统
- 5.2.7 基于上下文敏感的推荐系统
- 5.2.8 基于组群的推荐系统
- 5.3 推荐系统评测
- 5.3.1 推荐系统评测环境
- 5.3.2 推荐系统评测指标
- 5.4 推荐系统实例
- 5.4.1 新闻推荐
- 5.4.2 POI推荐
- 参考文献
- 第6章 智能问答系统
- 6.1 发展历史
- 6.2 句法分析
- 6.2.1 中文分词技术
- 6.2.2 词的分类和兼类
- 6.2.3 汉语句法分析
- 6.3 问题理解
- 6.3.1 词法分析
- 6.3.2 问题分类
- 6.3.3 关键词扩展与抽取
- 6.3.4 答案抽取
- 6.4 问题检索
- 6.4.1 基于词法的问句检索
- 6.4.2 基于句法的问句检索
- 6.4.3 基于语义的问句检索
- 6.4.4 常见问题集的问句检索
- 6.5 信息抽取
- 6.5.1 抽取的对象
- 6.5.2 抽取的种类
- 6.5.3 抽取的方法
- 6.6 知识库构建
- 6.6.1 基本概念
- 6.6.2 体系结构
- 6.6.3 关键技术
- 6.7 知识推理
- 6.7.1 线索挖掘
- 6.7.2 关系推理
- 6.7.3 关系预测
- 6.8 案例分析
- 6.8.1 限定域系统的现有案例分析
- 6.8.2 开放域系统的现有案例分析
- 参考文献
- 第7章 文本挖掘
- 7.1 文本表示
- 7.2 话题挖掘
- 7.2.1 非负矩阵分解
- 7.2.2 概率潜在语义分析
- 7.2.3 潜在狄利克雷分配模型
- 7.2.4 分析与实例比较
- 7.3 多文档自动文摘
- 7.3.1 目标函数选择:句子重要性评价
- 7.3.2 优化方法
- 7.3.3 其他的自动文摘问题
- 7.3.4 实例分析
- 7.4 情感分析和摘要
- 7.4.1 基于频繁项集的方法
- 7.4.2 实例分析
- 7.4.3 基于方面的话题模型分析方法
- 7.5 数据挖掘在专利分析中的应用
- 7.5.1 专利分析的内容、流程与方法
- 7.5.2 数据挖掘在专利分析中的应用方向
- 参考文献
- 第8章 多媒体数据挖掘
- 8.1 多媒体技术的特点
- 8.1.1 数字化
- 8.1.2 多样性
- 8.1.3 集成性
- 8.1.4 交互性
- 8.1.5 非线性
- 8.1.6 实时性
- 8.2 多媒体数据挖掘概述
- 8.2.1 背景
- 8.2.2 研究及应用现状
- 8.3 多媒体数据的特征抽取
- 8.3.1 文本特征抽取
- 8.3.2 图像特征表示
- 8.4 数据挖掘在图像检索中的应用
- 8.4.1 应用背景
- 8.4.2 数据集描述
- 8.4.3 数据挖掘在图像检索中的算法分析
- 8.4.4 图像检索案例
- 8.5 数据挖掘在多媒体信息融合中的应用
- 8.5.1 应用背景
- 8.5.2 数据集描述
- 8.5.3 数据挖掘在多媒体信息融合中的算法分析
- 8.5.4 多媒体信息融合案例
- 8.6 数据挖掘在人脸识别中的应用
- 8.6.1 应用背景
- 8.6.2 数据集描述
- 8.6.3 人脸识别算法分析
- 8.6.4 分布式人脸识别系统设计
- 参考文献
- 第9章 社交媒体挖掘
- 9.1 社交媒体数据挖掘简介
- 9.1.1 社交媒体分析的特点综述
- 9.1.2 社交媒体的典型应用
- 9.2 社交网络数据
- 9.3 数据挖掘在社交媒体热点问题上的应用
- 9.3.1 社交媒体数据挖掘需求
- 9.3.2 信息扩散分析
- 9.3.3 链接的预测
- 9.3.4 专家与关键人物的挖掘
- 9.3.5 搜索
- 9.3.6 信任
- 9.3.7 社交网络的内容与情感挖掘
- 参考文献
- 第10章 时空数据挖掘
- 10.1 时空数据挖掘的发展背景
- 10.2 时空数据挖掘的相关研究
- 10.2.1 时空数据的来源
- 10.2.2 时空数据的基本性质
- 10.2.3 时空数据挖掘的方法与任务
- 10.3 时空数据的模式挖掘
- 10.3.1 时空数据的频繁模式
- 10.3.2 时空数据的异常模式
- 10.4 时空数据的聚类和分类
- 10.4.1 时空数据的聚类
- 10.4.2 时空数据的分类
- 10.5 时空数据预测
- 10.5.1 位置预测
- 10.5.2 位置推荐
- 10.6 时空数据挖掘的案例研究
- 10.6.1 TerryFly GeoCloud
- 10.6.2 NUPT-ST-Miner
- 10.7 时空数据挖掘的挑战和发展
- 参考文献
- 第11章 生物信息学
- 11.1 生物医学知识综述
- 11.2 生物医学大数据
- 11.3 数据挖掘在蛋白质与核酸相互作用研究中的应用
- 11.3.1 基于机器学习的蛋白质与核酸相互作用的研究策略
- 11.3.2 案例分析:蛋白质中RNA—结合残基的预测模型
- 11.4 数据挖掘在生物医学文献中的应用
- 11.4.1 生物医学文献挖掘概述
- 11.4.2 数据挖掘应用方法描述
- 11.5 数据挖掘在基因表达数据中的应用
- 11.5.1 基因芯片技术
- 11.5.2 下一代高通量测序技术
- 11.5.3 RNA-Seq技术与基因芯片技术的比较
- 11.5.4 数据挖掘在下一代高通量RNA-Seq测序数据中的应用
- 参考文献
- 第12章 隐私保护和数据挖掘
- 12.1 隐私保护概述
- 12.1.1 隐私侵害事件
- 12.1.2 隐私保护困境
- 12.1.3 隐私保护要求
- 12.1.4 隐私保护水平度量
- 12.2 隐私保护技术分类
- 12.2.1 匿名化技术
- 12.2.2 加密技术
- 12.2.3 数据扰动技术
- 12.3 隐私保护数据挖掘方法
- 12.3.1 隐私保护聚类
- 12.3.2 隐私保护决策树
- 12.3.3 隐私保护推荐系统
- 12.3.4 隐私保护贝叶斯算法
- 12.3.5 隐私保护支持向量机
- 12.3.6 隐私保护关联规则挖掘
- 12.4 复杂数据挖掘场景下的隐私保护
- 12.4.1 大数据隐私保护
- 12.4.2 图数据隐私保护
- 12.4.3 云数据隐私保护
- 12.4.4 隐私保护深度学习
- 参考文献
- 第13章 健康医疗大数据中的数据挖掘技术
- 13.1 健康医疗大数据的含义
- 13.2 数据特性
- 13.3 预警系统
- 13.3.1 数据预处理
- 13.3.2 Bucketing
- 13.3.3 Bucket Bagging
- 13.3.4 特征集构造
- 13.3.5 特征选择
- 13.3.6 探索性下采样
- 13.3.7 指数移动平均
- 13.4 非结构化文本信息的挖掘
- 13.5 数据挖掘实例
- 13.5.1 评价标准
- 13.5.2 实验设计
- 13.5.3 逻辑回归模型的实验结果
- 13.5.4 算法比较
- 13.5.5 预警时间分析
- 13.6 应用方向
- 13.6.1 疾病预警预测及生存期分析
- 13.6.2 疾病辅助诊断治疗
- 13.6.3 药物研究
- 13.6.4 医学影像
- 13.6.5 医院信息系统
- 13.6.6 远程医疗
- 13.6.7 健康数据库管理
- 13.6.8 医疗健康相关企业经营
- 参考文献
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。
