展开全部

主编推荐语

《Java数据分析全攻略》:11章教授数据分析、数据库、编程技巧。

内容简介

本书包含11章内容,详细介绍了数据分析、数据预处理、数据可视化、数据统计、关系型数据库、回归分析、分类法、聚类法、推荐系统、NoSQL数据库以及Java大数据分析等内容。由浅入深地带领读者了解数据分析的各项要点,并结合具体的代码示例讲解如何通过Java及相关编程方法实现数据分析。

目录

  • 版权信息
  • 版权声明
  • 内容提要
  • 译者简介
  • 作者简介
  • 审阅者简介
  • 前言
  • 本书内容
  • 阅读准备
  • 目标读者
  • 排版约定
  • 注释
  • 提示
  • 资源与支持
  • 配套资源
  • 提交勘误
  • 与我们联系
  • 关于异步社区和异步图书
  • 第1章 数据科学导论
  • 1.1 数据分析起源
  • 1.2 科学方法
  • 1.3 精算科学
  • 1.4 蒸汽计算
  • 1.5 一个惊人的例子
  • 1.6 赫尔曼·何乐礼
  • 1.7 ENIAC
  • 1.8 VisiCalc
  • 1.9 数据、信息和知识
  • 1.10 为什么用Java
  • 1.11 Java集成开发环境
  • 1.12 小结
  • 第2章 数据预处理
  • 2.1 数据类型
  • 2.2 变量
  • 2.3 数据点和数据集
  • 2.4 关系数据库表
  • 2.4.1 关键字段
  • 2.4.2 键—值对
  • 2.5 哈希表
  • 2.6 文件格式
  • 2.6.1 微软Excel数据
  • 2.6.2 XML和JSON数据
  • 2.7 生成测试数据集
  • 2.7.1 元数据
  • 2.7.2 数据清洗
  • 2.7.3 数据缩放
  • 2.7.4 数据过滤
  • 2.7.5 排序
  • 2.7.6 合并
  • 2.7.7 散列法
  • 2.8 小结
  • 第3章 数据可视化
  • 3.1 表和图
  • 3.1.1 散点图
  • 3.1.2 线图
  • 3.1.3 条形图
  • 3.1.4 直方图
  • 3.2 时间序列
  • 3.3 Java实现
  • 3.4 移动平均
  • 3.5 数据排序
  • 3.6 频率分布
  • 3.7 正态分布
  • 3.8 指数分布
  • 3.9 Java示例
  • 3.10 小结
  • 第4章 统计
  • 4.1 描述性统计量
  • 4.2 随机抽样
  • 4.3 随机变量
  • 4.4 概率分布
  • 4.5 累积分布
  • 4.6 二项分布
  • 4.7 多元分布
  • 4.8 条件概率
  • 4.9 概率事件的独立性
  • 4.10 列联表
  • 4.11 贝叶斯定理
  • 4.12 协方差和相关
  • 4.13 标准正态分布
  • 4.14 中心极限定理
  • 4.15 置信区间
  • 4.16 假设检验
  • 4.17 小结
  • 第5章 关系数据库
  • 5.1 关系数据模型
  • 5.2 关系数据库
  • 5.3 外键
  • 5.4 关系数据库设计
  • 5.4.1 创建数据库
  • 5.4.2 SQL命令
  • 5.4.3 数据插入数据库
  • 5.4.4 数据库查询
  • 5.4.5 SQL数据类型
  • 5.4.6 JDBC
  • 5.4.7 使用JDBC PreparedStatement
  • 5.4.8 批处理
  • 5.4.9 数据库视图
  • 5.4.10 子查询
  • 5.4.11 表索引
  • 5.5 小结
  • 第6章 回归分析
  • 6.1 线性回归
  • 6.1.1 Excel中的线性回归
  • 6.1.2 计算回归系数
  • 6.1.3 变异统计量
  • 6.1.4 线性回归的Java实现
  • 6.1.5 安斯库姆的四重奏
  • 6.2 多项式回归
  • 6.2.1 多元线性回归
  • 6.2.2 Apache Commons的实现
  • 6.2.3 曲线拟合
  • 6.3 小结
  • 第7章 分类分析
  • 7.1 决策树
  • 7.1.1 熵和它有什么关系?
  • 7.1.2 ID3算法
  • 7.1.3 Weka平台
  • 7.1.4 数据的ARFF文件类型
  • 7.1.5 Weka的Java实现
  • 7.2 贝叶斯分类器
  • 7.2.1 Weka的Java实现
  • 7.2.2 支持向量机算法
  • 7.3 逻辑回归
  • 7.3.1 k近邻算法
  • 7.3.2 模糊分类算法
  • 7.4 小结
  • 第8章 聚类分析
  • 8.1 测量距离
  • 8.2 维数灾难
  • 8.3 层次聚类法
  • 8.3.1 Weka实现
  • 8.3.2 K-均值聚类
  • 8.3.3 k-中心点聚类
  • 8.3.4 仿射传播聚类
  • 8.4 小结
  • 第9章 推荐系统
  • 9.1 效用矩阵
  • 9.2 相似性度量
  • 9.3 余弦相似性
  • 9.4 一个简单的推荐系统
  • 9.5 亚马逊项目对项目的协同过滤推荐
  • 9.6 实现用户评分
  • 9.7 大型稀疏矩阵
  • 9.8 使用随机访问文件
  • 9.9 Netflix大奖赛
  • 9.10 小结
  • 第10章 NoSQL数据库
  • 10.1 映射数据结构
  • 10.2 SQL与NoSQL
  • 10.3 Mongo数据库系统
  • 10.4 Library数据库
  • 10.5 MongoDB的Java开发
  • 10.6 MongoDB的地理空间数据库扩展
  • 10.7 MongoDB中的索引
  • 10.8 为什么选择NoSQL,为什么选择MongoDB
  • 10.9 其他的NoSQL数据库系统
  • 10.10 小结
  • 第11章 Java大数据分析
  • 11.1 扩展、数据分块和分片
  • 11.2 谷歌的PageRank算法
  • 11.3 谷歌的MapReduce框架
  • 11.4 MapReduce的一些应用示例
  • 11.5 “单词计数”示例
  • 11.6 可扩展性
  • 11.7 MapReduce的矩阵操作
  • 11.8 MongoDB中的MapReduce
  • 11.9 Apache Hadoop
  • 11.10 Hadoop MapReduce
  • 11.11 小结
  • 附录 Java工具
  • 命令行
  • Java
  • NetBeans
  • MySQL
  • MySQL Workbench
  • 从NetBeans访问MySQL数据库
  • Apache Commons Math库
  • javax JSON库
  • Weka库
  • MongoDB
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。