计算机
类型
可以朗读
语音朗读
149千字
字数
2018-11-01
发行日期
展开全部
主编推荐语
《Java数据分析全攻略》:11章教授数据分析、数据库、编程技巧。
内容简介
本书包含11章内容,详细介绍了数据分析、数据预处理、数据可视化、数据统计、关系型数据库、回归分析、分类法、聚类法、推荐系统、NoSQL数据库以及Java大数据分析等内容。由浅入深地带领读者了解数据分析的各项要点,并结合具体的代码示例讲解如何通过Java及相关编程方法实现数据分析。
目录
- 版权信息
- 版权声明
- 内容提要
- 译者简介
- 作者简介
- 审阅者简介
- 前言
- 本书内容
- 阅读准备
- 目标读者
- 排版约定
- 注释
- 提示
- 资源与支持
- 配套资源
- 提交勘误
- 与我们联系
- 关于异步社区和异步图书
- 第1章 数据科学导论
- 1.1 数据分析起源
- 1.2 科学方法
- 1.3 精算科学
- 1.4 蒸汽计算
- 1.5 一个惊人的例子
- 1.6 赫尔曼·何乐礼
- 1.7 ENIAC
- 1.8 VisiCalc
- 1.9 数据、信息和知识
- 1.10 为什么用Java
- 1.11 Java集成开发环境
- 1.12 小结
- 第2章 数据预处理
- 2.1 数据类型
- 2.2 变量
- 2.3 数据点和数据集
- 2.4 关系数据库表
- 2.4.1 关键字段
- 2.4.2 键—值对
- 2.5 哈希表
- 2.6 文件格式
- 2.6.1 微软Excel数据
- 2.6.2 XML和JSON数据
- 2.7 生成测试数据集
- 2.7.1 元数据
- 2.7.2 数据清洗
- 2.7.3 数据缩放
- 2.7.4 数据过滤
- 2.7.5 排序
- 2.7.6 合并
- 2.7.7 散列法
- 2.8 小结
- 第3章 数据可视化
- 3.1 表和图
- 3.1.1 散点图
- 3.1.2 线图
- 3.1.3 条形图
- 3.1.4 直方图
- 3.2 时间序列
- 3.3 Java实现
- 3.4 移动平均
- 3.5 数据排序
- 3.6 频率分布
- 3.7 正态分布
- 3.8 指数分布
- 3.9 Java示例
- 3.10 小结
- 第4章 统计
- 4.1 描述性统计量
- 4.2 随机抽样
- 4.3 随机变量
- 4.4 概率分布
- 4.5 累积分布
- 4.6 二项分布
- 4.7 多元分布
- 4.8 条件概率
- 4.9 概率事件的独立性
- 4.10 列联表
- 4.11 贝叶斯定理
- 4.12 协方差和相关
- 4.13 标准正态分布
- 4.14 中心极限定理
- 4.15 置信区间
- 4.16 假设检验
- 4.17 小结
- 第5章 关系数据库
- 5.1 关系数据模型
- 5.2 关系数据库
- 5.3 外键
- 5.4 关系数据库设计
- 5.4.1 创建数据库
- 5.4.2 SQL命令
- 5.4.3 数据插入数据库
- 5.4.4 数据库查询
- 5.4.5 SQL数据类型
- 5.4.6 JDBC
- 5.4.7 使用JDBC PreparedStatement
- 5.4.8 批处理
- 5.4.9 数据库视图
- 5.4.10 子查询
- 5.4.11 表索引
- 5.5 小结
- 第6章 回归分析
- 6.1 线性回归
- 6.1.1 Excel中的线性回归
- 6.1.2 计算回归系数
- 6.1.3 变异统计量
- 6.1.4 线性回归的Java实现
- 6.1.5 安斯库姆的四重奏
- 6.2 多项式回归
- 6.2.1 多元线性回归
- 6.2.2 Apache Commons的实现
- 6.2.3 曲线拟合
- 6.3 小结
- 第7章 分类分析
- 7.1 决策树
- 7.1.1 熵和它有什么关系?
- 7.1.2 ID3算法
- 7.1.3 Weka平台
- 7.1.4 数据的ARFF文件类型
- 7.1.5 Weka的Java实现
- 7.2 贝叶斯分类器
- 7.2.1 Weka的Java实现
- 7.2.2 支持向量机算法
- 7.3 逻辑回归
- 7.3.1 k近邻算法
- 7.3.2 模糊分类算法
- 7.4 小结
- 第8章 聚类分析
- 8.1 测量距离
- 8.2 维数灾难
- 8.3 层次聚类法
- 8.3.1 Weka实现
- 8.3.2 K-均值聚类
- 8.3.3 k-中心点聚类
- 8.3.4 仿射传播聚类
- 8.4 小结
- 第9章 推荐系统
- 9.1 效用矩阵
- 9.2 相似性度量
- 9.3 余弦相似性
- 9.4 一个简单的推荐系统
- 9.5 亚马逊项目对项目的协同过滤推荐
- 9.6 实现用户评分
- 9.7 大型稀疏矩阵
- 9.8 使用随机访问文件
- 9.9 Netflix大奖赛
- 9.10 小结
- 第10章 NoSQL数据库
- 10.1 映射数据结构
- 10.2 SQL与NoSQL
- 10.3 Mongo数据库系统
- 10.4 Library数据库
- 10.5 MongoDB的Java开发
- 10.6 MongoDB的地理空间数据库扩展
- 10.7 MongoDB中的索引
- 10.8 为什么选择NoSQL,为什么选择MongoDB
- 10.9 其他的NoSQL数据库系统
- 10.10 小结
- 第11章 Java大数据分析
- 11.1 扩展、数据分块和分片
- 11.2 谷歌的PageRank算法
- 11.3 谷歌的MapReduce框架
- 11.4 MapReduce的一些应用示例
- 11.5 “单词计数”示例
- 11.6 可扩展性
- 11.7 MapReduce的矩阵操作
- 11.8 MongoDB中的MapReduce
- 11.9 Apache Hadoop
- 11.10 Hadoop MapReduce
- 11.11 小结
- 附录 Java工具
- 命令行
- Java
- NetBeans
- MySQL
- MySQL Workbench
- 从NetBeans访问MySQL数据库
- Apache Commons Math库
- javax JSON库
- Weka库
- MongoDB
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。