展开全部

主编推荐语

注重原理思想的数据挖掘实用指南。

内容简介

本书注重原理和思想,不过多纠缠技术细节,尽量简化数学公式和模型, 强调其背后的基本思想和出发点。 以实际的应用案例来贯穿始终,通过数据挖掘应用的实例来介绍如何应用和学习数据挖掘技术。主要包括几方面内容:数据挖掘的数学基础、计算机系统日志挖掘、下一代智能推荐系统、文本推荐、灾难信息管理、数据挖掘和信息安全、云数据和服务数据分析、社交媒体分析、高端智能制造。

目录

  • 封面
  • 扉页
  • 版权信息
  • 目录
  • 内容提要
  • 《国之重器出版工程》编辑委员会
  • 《学术中国·大数据》丛书编辑委员会
  • 丛书总序
  • 前言
  • 第1章 数据挖掘简介
  • 1.1 大数据时代的数据挖掘
  • 1.1.1 大数据的特点“4V+4V”
  • 1.1.2 数据挖掘
  • 1.1.3 从数据挖掘应用的角度看大数据
  • 1.2 数据挖掘技术的发展历史
  • 1.3 十大数据挖掘算法简介
  • 1.4 数据挖掘平台:FIU-Miner
  • 1.4.1 FIU-Miner平台简介
  • 1.4.2 FIU-Miner系统架构
  • 1.4.3 FIU-Miner应用实例
  • 参考文献
  • 第2章 系统日志和事件的挖掘
  • 2.1 数据驱动的网络运维
  • 2.1.1 网络运维1.0阶段:简单数据处理
  • 2.1.2 网络运维2.0阶段:分布式大数据处理框架
  • 2.1.3 网络运维3.0阶段:网络运维平台套件
  • 2.1.4 网络运维4.0阶段:智能化网络运维
  • 2.2 系统日志分析的目的
  • 2.2.1 系统问题诊断
  • 2.2.2 调试与优化
  • 2.2.3 系统安全维护
  • 2.3 日志数据分析管理系统的架构
  • 2.3.1 日志数据的收集和预处理
  • 2.3.2 历史日志数据存储
  • 2.3.3 日志事件数据的分析以及对分析结果的展示和使用
  • 2.4 系统日志的数据形式
  • 2.4.1 无结构的日志数据
  • 2.4.2 结构化与半结构化的日志数据
  • 2.4.3 非结构化数据的转换
  • 2.5 基于日志数据的异常检测
  • 2.5.1 基于监督学习的异常检测
  • 2.5.2 基于无监督学习的异常检测
  • 2.6 系统故障根源跟踪
  • 2.6.1 日志事件的依赖性挖掘
  • 2.6.2 基于依赖关系的系统故障追踪
  • 2.7 日志事件总结
  • 2.7.1 事件总结算法基本要求及相关工作
  • 2.7.2 基于事件发生频率变迁描述的事件总结
  • 2.7.3 基于马尔可夫模型描述的事件总结
  • 2.7.4 基于事件关系网络描述的事件总结
  • 参考文献
  • 第3章 工作票数据挖掘
  • 3.1 工作票简介
  • 3.2 工作票产生机制和亟待解决的问题
  • 3.3 研究现状
  • 3.3.1 工作票分类
  • 3.3.2 工作票推荐
  • 3.3.3 整体解决方案和工具
  • 3.4 工作票漏报和误报检测
  • 3.4.1 漏报和误报
  • 3.4.2 基于规则的误报识别方法
  • 3.4.3 半监督的工作票漏报发现方法
  • 3.4.4 评价
  • 3.5 层次多标签工作票分类
  • 3.5.1 问题描述
  • 3.5.2 层次损失函数和期望损失最小化
  • 3.5.3 算法和解决方案
  • 3.5.4 实验
  • 3.6 工作票解决方案推荐
  • 3.6.1 背景
  • 3.6.2 基于KNN的推荐方法
  • 3.6.3 划分方法
  • 3.6.4 概率融合方法
  • 3.6.5 度量学习方法
  • 3.6.6 实验
  • 参考文献
  • 第4章 大数据与计算可持续性研究
  • 4.1 大数据与可持续发展
  • 4.1.1 可持续发展
  • 4.1.2 大数据时代可持续发展面临的机遇和挑战
  • 4.2 计算可持续性
  • 4.2.1 计算可持续性数据及其特征
  • 4.2.2 大数据环境下计算可持续性研究现状
  • 4.3 研究案例
  • 4.3.1 基于数据驱动的气象分析
  • 4.3.2 基于数据驱动的建筑能耗分析
  • 参考文献
  • 第5章 推荐系统
  • 5.1 个性化推荐系统概述
  • 5.2 推荐技术
  • 5.2.1 基于内容的推荐系统
  • 5.2.2 基于协同过滤的推荐系统
  • 5.2.3 基于知识的推荐系统
  • 5.2.4 基于混合技术的推荐系统
  • 5.2.5 基于计算智能的推荐系统
  • 5.2.6 基于社交网络的推荐系统
  • 5.2.7 基于上下文敏感的推荐系统
  • 5.2.8 基于组群的推荐系统
  • 5.3 推荐系统评测
  • 5.3.1 推荐系统评测环境
  • 5.3.2 推荐系统评测指标
  • 5.4 推荐系统实例
  • 5.4.1 新闻推荐
  • 5.4.2 POI推荐
  • 参考文献
  • 第6章 智能问答系统
  • 6.1 发展历史
  • 6.2 句法分析
  • 6.2.1 中文分词技术
  • 6.2.2 词的分类和兼类
  • 6.2.3 汉语句法分析
  • 6.3 问题理解
  • 6.3.1 词法分析
  • 6.3.2 问题分类
  • 6.3.3 关键词扩展与抽取
  • 6.3.4 答案抽取
  • 6.4 问题检索
  • 6.4.1 基于词法的问句检索
  • 6.4.2 基于句法的问句检索
  • 6.4.3 基于语义的问句检索
  • 6.4.4 常见问题集的问句检索
  • 6.5 信息抽取
  • 6.5.1 抽取的对象
  • 6.5.2 抽取的种类
  • 6.5.3 抽取的方法
  • 6.6 知识库构建
  • 6.6.1 基本概念
  • 6.6.2 体系结构
  • 6.6.3 关键技术
  • 6.7 知识推理
  • 6.7.1 线索挖掘
  • 6.7.2 关系推理
  • 6.7.3 关系预测
  • 6.8 案例分析
  • 6.8.1 限定域系统的现有案例分析
  • 6.8.2 开放域系统的现有案例分析
  • 参考文献
  • 第7章 文本挖掘
  • 7.1 文本表示
  • 7.2 话题挖掘
  • 7.2.1 非负矩阵分解
  • 7.2.2 概率潜在语义分析
  • 7.2.3 潜在狄利克雷分配模型
  • 7.2.4 分析与实例比较
  • 7.3 多文档自动文摘
  • 7.3.1 目标函数选择:句子重要性评价
  • 7.3.2 优化方法
  • 7.3.3 其他的自动文摘问题
  • 7.3.4 实例分析
  • 7.4 情感分析和摘要
  • 7.4.1 基于频繁项集的方法
  • 7.4.2 实例分析
  • 7.4.3 基于方面的话题模型分析方法
  • 7.5 数据挖掘在专利分析中的应用
  • 7.5.1 专利分析的内容、流程与方法
  • 7.5.2 数据挖掘在专利分析中的应用方向
  • 参考文献
  • 第8章 多媒体数据挖掘
  • 8.1 多媒体技术的特点
  • 8.1.1 数字化
  • 8.1.2 多样性
  • 8.1.3 集成性
  • 8.1.4 交互性
  • 8.1.5 非线性
  • 8.1.6 实时性
  • 8.2 多媒体数据挖掘概述
  • 8.2.1 背景
  • 8.2.2 研究及应用现状
  • 8.3 多媒体数据的特征抽取
  • 8.3.1 文本特征抽取
  • 8.3.2 图像特征表示
  • 8.4 数据挖掘在图像检索中的应用
  • 8.4.1 应用背景
  • 8.4.2 数据集描述
  • 8.4.3 数据挖掘在图像检索中的算法分析
  • 8.4.4 图像检索案例
  • 8.5 数据挖掘在多媒体信息融合中的应用
  • 8.5.1 应用背景
  • 8.5.2 数据集描述
  • 8.5.3 数据挖掘在多媒体信息融合中的算法分析
  • 8.5.4 多媒体信息融合案例
  • 8.6 数据挖掘在人脸识别中的应用
  • 8.6.1 应用背景
  • 8.6.2 数据集描述
  • 8.6.3 人脸识别算法分析
  • 8.6.4 分布式人脸识别系统设计
  • 参考文献
  • 第9章 社交媒体挖掘
  • 9.1 社交媒体数据挖掘简介
  • 9.1.1 社交媒体分析的特点综述
  • 9.1.2 社交媒体的典型应用
  • 9.2 社交网络数据
  • 9.3 数据挖掘在社交媒体热点问题上的应用
  • 9.3.1 社交媒体数据挖掘需求
  • 9.3.2 信息扩散分析
  • 9.3.3 链接的预测
  • 9.3.4 专家与关键人物的挖掘
  • 9.3.5 搜索
  • 9.3.6 信任
  • 9.3.7 社交网络的内容与情感挖掘
  • 参考文献
  • 第10章 时空数据挖掘
  • 10.1 时空数据挖掘的发展背景
  • 10.2 时空数据挖掘的相关研究
  • 10.2.1 时空数据的来源
  • 10.2.2 时空数据的基本性质
  • 10.2.3 时空数据挖掘的方法与任务
  • 10.3 时空数据的模式挖掘
  • 10.3.1 时空数据的频繁模式
  • 10.3.2 时空数据的异常模式
  • 10.4 时空数据的聚类和分类
  • 10.4.1 时空数据的聚类
  • 10.4.2 时空数据的分类
  • 10.5 时空数据预测
  • 10.5.1 位置预测
  • 10.5.2 位置推荐
  • 10.6 时空数据挖掘的案例研究
  • 10.6.1 TerryFly GeoCloud
  • 10.6.2 NUPT-ST-Miner
  • 10.7 时空数据挖掘的挑战和发展
  • 参考文献
  • 第11章 生物信息学
  • 11.1 生物医学知识综述
  • 11.2 生物医学大数据
  • 11.3 数据挖掘在蛋白质与核酸相互作用研究中的应用
  • 11.3.1 基于机器学习的蛋白质与核酸相互作用的研究策略
  • 11.3.2 案例分析:蛋白质中RNA—结合残基的预测模型
  • 11.4 数据挖掘在生物医学文献中的应用
  • 11.4.1 生物医学文献挖掘概述
  • 11.4.2 数据挖掘应用方法描述
  • 11.5 数据挖掘在基因表达数据中的应用
  • 11.5.1 基因芯片技术
  • 11.5.2 下一代高通量测序技术
  • 11.5.3 RNA-Seq技术与基因芯片技术的比较
  • 11.5.4 数据挖掘在下一代高通量RNA-Seq测序数据中的应用
  • 参考文献
  • 第12章 隐私保护和数据挖掘
  • 12.1 隐私保护概述
  • 12.1.1 隐私侵害事件
  • 12.1.2 隐私保护困境
  • 12.1.3 隐私保护要求
  • 12.1.4 隐私保护水平度量
  • 12.2 隐私保护技术分类
  • 12.2.1 匿名化技术
  • 12.2.2 加密技术
  • 12.2.3 数据扰动技术
  • 12.3 隐私保护数据挖掘方法
  • 12.3.1 隐私保护聚类
  • 12.3.2 隐私保护决策树
  • 12.3.3 隐私保护推荐系统
  • 12.3.4 隐私保护贝叶斯算法
  • 12.3.5 隐私保护支持向量机
  • 12.3.6 隐私保护关联规则挖掘
  • 12.4 复杂数据挖掘场景下的隐私保护
  • 12.4.1 大数据隐私保护
  • 12.4.2 图数据隐私保护
  • 12.4.3 云数据隐私保护
  • 12.4.4 隐私保护深度学习
  • 参考文献
  • 第13章 健康医疗大数据中的数据挖掘技术
  • 13.1 健康医疗大数据的含义
  • 13.2 数据特性
  • 13.3 预警系统
  • 13.3.1 数据预处理
  • 13.3.2 Bucketing
  • 13.3.3 Bucket Bagging
  • 13.3.4 特征集构造
  • 13.3.5 特征选择
  • 13.3.6 探索性下采样
  • 13.3.7 指数移动平均
  • 13.4 非结构化文本信息的挖掘
  • 13.5 数据挖掘实例
  • 13.5.1 评价标准
  • 13.5.2 实验设计
  • 13.5.3 逻辑回归模型的实验结果
  • 13.5.4 算法比较
  • 13.5.5 预警时间分析
  • 13.6 应用方向
  • 13.6.1 疾病预警预测及生存期分析
  • 13.6.2 疾病辅助诊断治疗
  • 13.6.3 药物研究
  • 13.6.4 医学影像
  • 13.6.5 医院信息系统
  • 13.6.6 远程医疗
  • 13.6.7 健康数据库管理
  • 13.6.8 医疗健康相关企业经营
  • 参考文献
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。