计算机
类型
可以朗读
语音朗读
234千字
字数
2018-01-01
发行日期
展开全部
主编推荐语
《Julia数据科学实践》:领域应用、原理、实例及练习。
内容简介
本书介绍了Julia在数据科学领域的应用以及相关的几个基本的数据科学原理,然后,详细介绍了如何安装Julia并发挥其功能强大的库。本书提供了众多的示例,展示了使用Julia命令、数据集和函数所能够解决的问题。本书每一章都带有练习和问题,帮助读者掌握Julia这一数据分析工具。
目录
- 版权信息
- 版权声明
- 内容提要
- 前言
- 第1章 Julia简介
- 1.1 Julia如何提高数据科学水平
- 1.1.1 数据科学工作流程
- 1.1.2 Julia被数据科学社区接受的过程
- 1.2 Julia 扩展
- 1.2.1 包的质量
- 1.2.2 找到新的包
- 1.3 关于本书
- 第2章 建立数据科学工作环境
- 2.1 Julia IDE
- 2.1.1 Juno
- 2.1.2 IJulia
- 2.1.3 其他IDE
- 2.2 Julia扩展包
- 2.2.1 找到并选择扩展包
- 2.2.2 安装扩展包
- 2.2.3 使用扩展包
- 2.2.4 破解扩展包
- 2.3 IJulia基础
- 2.3.1 文件处理
- 2.3.2 在.jl文件中组织代码
- 2.3.3 引用代码
- 2.3.4 工作目录
- 2.4 要使用的数据集
- 2.4.1 数据集描述
- 2.4.2 下载数据集
- 2.4.3 加载数据集
- 2.5 在Julia中实现一个简单的机器学习算法
- 2.5.1 算法描述
- 2.5.2 算法实现
- 2.5.3 算法测试
- 2.6 将工作区保存到数据文件
- 2.6.1 将数据保存为分隔值文件
- 2.6.2 将数据保存为Julia数据文件
- 2.6.3 将数据保存为文本文件
- 2.7 帮助
- 2.8 小结
- 2.9 思考题
- 第3章 Julia入门
- 3.1 数据类型
- 3.2 数组
- 3.2.1 数组基础
- 3.2.2 在数组中引用多个元素
- 3.2.3 多维数组
- 3.3 字典
- 3.4 基本命令与函数
- 3.4.1 print()和println()
- 3.4.2 typemax()和typemin()
- 3.4.3 collect()
- 3.4.4 show()
- 3.4.5 linspace()
- 3.5 数学函数
- 3.5.1 round()
- 3.5.2 rand()和randn()
- 3.5.3 sum()
- 3.5.4 mean()
- 3.6 数组与字典函数
- 3.6.1 in
- 3.6.2 append!()
- 3.6.3 pop!()
- 3.6.4 push!()
- 3.6.5 splice!()
- 3.6.6 insert!()
- 3.6.7 sort()和sort!()
- 3.6.8 get()
- 3.6.9 keys()和values()
- 3.6.10 length()和size()
- 3.7 其他函数
- 3.7.1 time()
- 3.7.2 条件语句
- 3.7.3 string()
- 3.7.4 map()
- 3.7.5 versioin()
- 3.8 运算符、循环语句与条件语句
- 3.8.1 运算符
- 3.8.2 循环语句
- 3.8.3 break命令
- 3.9 小结
- 3.10 思考题
- 第4章 Julia进阶
- 4.1 字符串处理
- 4.1.1 split()
- 4.1.2 join()
- 4.1.3 正则表达式函数
- 4.2 定制函数
- 4.2.1 函数结构
- 4.2.2 匿名函数
- 4.2.3 多分派
- 4.2.4 函数示例
- 4.3 实现简单算法
- 4.4 创建完整解决方案
- 4.5 小结
- 4.6 思考题
- 第5章 Julia数据科学应用概述
- 5.1 数据科学工作流程
- 5.2 数据工程
- 5.2.1 数据准备
- 5.2.2 数据探索
- 5.2.3 数据表示
- 5.3 数据建模
- 5.3.1 数据发现
- 5.3.2 数据学习
- 5.4 信息萃取
- 5.4.1 数据产品创建
- 5.4.2 知识、交付物与可视化产品
- 5.5 保持开放型思维
- 5.6 在实际问题中应用数据科学流程
- 5.6.1 数据准备
- 5.6.2 数据探索
- 5.6.3 数据表示
- 5.6.4 数据发现
- 5.6.5 数据学习
- 5.6.6 数据产品创建
- 5.6.7 知识、交付物和可视化产品
- 5.7 小结
- 5.8 思考题
- 第6章 Julia数据工程
- 6.1 数据框
- 6.1.1 创建并填充数据框
- 6.1.2 数据框基础
- 6.1.3 引用数据框中的特定变量
- 6.1.4 探索数据框
- 6.1.5 筛选数据框
- 6.1.6 在数据框变量上应用函数
- 6.1.7 使用数据框进行工作
- 6.1.8 修改数据框
- 6.1.9 对数据框的内容进行排序
- 6.1.10 数据框的一些补充建议
- 6.2 导入与导出数据
- 6.2.1 使用.json数据文件
- 6.2.2 保存数据到.json文件
- 6.2.3 将数据文件加载到数据框
- 6.2.4 保存数据框到数据文件
- 6.3 数据清洗
- 6.3.1 数值型数据的清洗
- 6.3.2 文本型数据的清洗
- 6.4 数据格式化与转换
- 6.4.1 数值型数据的格式化
- 6.4.2 文本数据的格式化
- 6.4.3 数据类型的重要性
- 6.5 对数值型数据进行转换
- 6.5.1 标准化
- 6.5.2 离散化(分箱)与二值化
- 6.5.3 二值变量转换为连续型变量(仅对于二值分类问题)
- 6.5.4 文本数据转换
- 6.5.5 大小写标准化
- 6.5.6 向量化
- 6.6 初步的特征评价
- 6.6.1 回归
- 6.6.2 分类
- 6.6.3 特征评价补充说明
- 6.7 小结
- 6.8 思考题
- 第7章 探索数据集
- 7.1 倾听数据
- 本章要使用的扩展包
- 7.2 计算基本统计量和相关性
- 7.2.1 变量概要
- 7.2.2 变量之间的相关性
- 7.2.3 两个变量之间的可比性
- 7.3 绘制统计图
- 7.3.1 图形语法
- 7.3.2 为可视化准备数据
- 7.3.3 箱线图
- 7.3.4 条形图
- 7.3.5 折线图
- 7.3.6 散点图
- 7.3.7 直方图
- 7.3.8 导出统计图到文件
- 7.4 假设检验
- 7.4.1 检验的基础知识
- 7.4.2 错误类型
- 7.4.3 灵敏度与特异度
- 7.4.4 显著性水平与检验力
- 7.4.5 KRUSKAL-WALLIS检验
- 7.4.6 T-检验
- 7.4.7 卡方检验
- 7.5 其他检验
- 7.6 统计检验附加说明
- 7.7 案例研究:探索OnlineNewsPopularity数据集
- 7.7.1 变量统计
- 7.7.2 可视化
- 7.7.3 假设
- 7.7.4 奇妙的T-SNE方法
- 7.7.5 结论
- 7.8 小结
- 7.9 思考题
- 第8章 构建数据空间
- 8.1 主成分分析
- 8.1.1 在Julia中使用PCA
- 8.1.2 独立成分分析:主成分分析的最常用替代方法
- 8.2 特征评价与选择
- 8.2.1 方法论概述
- 8.2.2 在Julia中使用余弦相似度进行特征评价与选择
- 8.2.3 在Julia中使用DID进行特征评价与选择
- 8.2.4 特征评价与选择方法的优缺点
- 8.3 其他数据降维技术
- 8.3.1 其他降维方法概述
- 8.3.2 何时使用高级降维方法
- 8.4 小结
- 8.5 思考题
- 第9章 数据抽样与结果评价
- 9.1 抽样技术
- 9.1.1 基本抽样
- 9.1.2 分层抽样
- 9.2 分类问题的性能指标
- 9.2.1 混淆矩阵
- 9.2.2 准确度
- 9.2.3 精确度与召回度
- 9.2.4 F1指标
- 9.2.5 误判成本
- 9.2.6 受试者工作特征(ROC)曲线及相关指标
- 9.3 回归问题的性能指标
- 9.3.1 MSE及其变种RMSE
- 9.3.2 SSE
- 9.3.3 其他指标
- 9.4 K折交叉验证(KFCV)
- 9.4.1 在Julia中应用KFCV
- 9.4.2 KFCV小提示
- 9.5 小结
- 9.6 思考题
- 第10章 无监督式机器学习
- 10.1 无监督式学习基础知识
- 10.1.1 聚类的类型
- 10.1.2 距离的度量
- 10.2 使用K-均值算法分组数据
- 10.2.1 使用Julia实现K-均值聚类
- 10.2.2 对K-均值算法的使用建议
- 10.3 密度和DBSCAN算法
- 10.3.1 DBSCAN算法
- 10.3.2 在Julia中应用DBSCAN
- 10.4 层次聚类
- 10.4.1 在Julia中使用层次聚类
- 10.4.2 何时使用层次聚类
- 10.5 聚类的验证方式
- 10.5.1 Silhouettes
- 10.5.2 关于聚类验证的一些建议
- 10.6 关于有效进行聚类的一些建议
- 10.6.1 处理高维数据
- 10.6.2 标准化
- 10.6.3 可视化建议
- 10.7 小结
- 10.8 思考题
- 第11章 监督式机器学习
- 11.1 决策树
- 11.1.1 在Julia中使用决策树
- 11.1.2 关于决策树的一些建议
- 11.2 回归树
- 11.2.1 在Julia中实现回归树
- 11.2.2 关于回归树的一些建议
- 11.3 随机森林
- 11.3.1 在Julia中使用随机森林进行分类
- 11.3.2 在Julia中使用随机森林进行回归
- 11.3.3 关于随机森林的一些建议
- 11.4 基本神经网络
- 11.4.1 在Julia中使用神经网络
- 11.4.2 关于神经网络的一些建议
- 11.5 极限学习机
- 11.5.1 在Julia中使用ELM
- 11.5.2 关于ELM的一些建议
- 11.6 用于回归分析的统计模型
- 11.6.1 在Julia中使用统计回归
- 11.6.2 关于统计回归的一些建议
- 11.7 其他监督式学习系统
- 11.7.1 提升树
- 11.7.2 支持向量机
- 11.7.3 直推式系统
- 11.7.4 深度学习系统
- 11.7.5 贝叶斯网络
- 11.8 小结
- 11.9 本章思考题
- 第12章 图分析
- 12.1 图的重要性
- 12.2 定制数据集
- 12.3 图的统计量
- 12.4 环的检测
- 用Julia检测环
- 12.5 连通子图
- 12.6 团
- 12.7 图的最短路径
- 12.8 最小生成树
- 12.8.1 在Julia中实现MST
- 12.8.2 用文件保存和加载图
- 12.9 Julia在图分析中的作用
- 12.10 小结
- 12.11 思考题
- 第13章 更上一层楼
- 13.1 Julia社区
- 13.1.1 与其他Julia用户进行交流
- 13.1.2 代码库
- 13.1.3 视频文件
- 13.1.4 新闻
- 13.2 学以致用
- 13.2.1 从这些特征开始
- 13.2.2 关于这个项目的一些思考
- 13.3 在数据科学中使用Julia的最后思考
- 13.3.1 不断提高Julia编程水平
- 13.3.2 贡献Julia项目
- 13.3.3 Julia在数据科学中的未来
- 附录A 下载安装Julia与IJulia
- 附录B 与Julia相关的一些常用站点
- 附录C 本书所用的扩展包
- 附录D Julia与其他平台的集成
- D.1 Julia与R的集成
- D.1.1 在R中运行Julia脚本
- D.1.2 在Julia中运行R脚本
- D.2 Julia与Python的集成
- D.2.1 在Python中运行Julia脚本
- D.2.2 在Julia中运行Python脚本
- 附录E Julia中的并行处理
- 附录F 各章思考题答案
- 欢迎来到异步社区!
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。