展开全部

主编推荐语

《Julia数据科学实践》:领域应用、原理、实例及练习。

内容简介

本书介绍了Julia在数据科学领域的应用以及相关的几个基本的数据科学原理,然后,详细介绍了如何安装Julia并发挥其功能强大的库。本书提供了众多的示例,展示了使用Julia命令、数据集和函数所能够解决的问题。本书每一章都带有练习和问题,帮助读者掌握Julia这一数据分析工具。

目录

  • 版权信息
  • 版权声明
  • 内容提要
  • 前言
  • 第1章 Julia简介
  • 1.1 Julia如何提高数据科学水平
  • 1.1.1 数据科学工作流程
  • 1.1.2 Julia被数据科学社区接受的过程
  • 1.2 Julia 扩展
  • 1.2.1 包的质量
  • 1.2.2 找到新的包
  • 1.3 关于本书
  • 第2章 建立数据科学工作环境
  • 2.1 Julia IDE
  • 2.1.1 Juno
  • 2.1.2 IJulia
  • 2.1.3 其他IDE
  • 2.2 Julia扩展包
  • 2.2.1 找到并选择扩展包
  • 2.2.2 安装扩展包
  • 2.2.3 使用扩展包
  • 2.2.4 破解扩展包
  • 2.3 IJulia基础
  • 2.3.1 文件处理
  • 2.3.2 在.jl文件中组织代码
  • 2.3.3 引用代码
  • 2.3.4 工作目录
  • 2.4 要使用的数据集
  • 2.4.1 数据集描述
  • 2.4.2 下载数据集
  • 2.4.3 加载数据集
  • 2.5 在Julia中实现一个简单的机器学习算法
  • 2.5.1 算法描述
  • 2.5.2 算法实现
  • 2.5.3 算法测试
  • 2.6 将工作区保存到数据文件
  • 2.6.1 将数据保存为分隔值文件
  • 2.6.2 将数据保存为Julia数据文件
  • 2.6.3 将数据保存为文本文件
  • 2.7 帮助
  • 2.8 小结
  • 2.9 思考题
  • 第3章 Julia入门
  • 3.1 数据类型
  • 3.2 数组
  • 3.2.1 数组基础
  • 3.2.2 在数组中引用多个元素
  • 3.2.3 多维数组
  • 3.3 字典
  • 3.4 基本命令与函数
  • 3.4.1 print()和println()
  • 3.4.2 typemax()和typemin()
  • 3.4.3 collect()
  • 3.4.4 show()
  • 3.4.5 linspace()
  • 3.5 数学函数
  • 3.5.1 round()
  • 3.5.2 rand()和randn()
  • 3.5.3 sum()
  • 3.5.4 mean()
  • 3.6 数组与字典函数
  • 3.6.1 in
  • 3.6.2 append!()
  • 3.6.3 pop!()
  • 3.6.4 push!()
  • 3.6.5 splice!()
  • 3.6.6 insert!()
  • 3.6.7 sort()和sort!()
  • 3.6.8 get()
  • 3.6.9 keys()和values()
  • 3.6.10 length()和size()
  • 3.7 其他函数
  • 3.7.1 time()
  • 3.7.2 条件语句
  • 3.7.3 string()
  • 3.7.4 map()
  • 3.7.5 versioin()
  • 3.8 运算符、循环语句与条件语句
  • 3.8.1 运算符
  • 3.8.2 循环语句
  • 3.8.3 break命令
  • 3.9 小结
  • 3.10 思考题
  • 第4章 Julia进阶
  • 4.1 字符串处理
  • 4.1.1 split()
  • 4.1.2 join()
  • 4.1.3 正则表达式函数
  • 4.2 定制函数
  • 4.2.1 函数结构
  • 4.2.2 匿名函数
  • 4.2.3 多分派
  • 4.2.4 函数示例
  • 4.3 实现简单算法
  • 4.4 创建完整解决方案
  • 4.5 小结
  • 4.6 思考题
  • 第5章 Julia数据科学应用概述
  • 5.1 数据科学工作流程
  • 5.2 数据工程
  • 5.2.1 数据准备
  • 5.2.2 数据探索
  • 5.2.3 数据表示
  • 5.3 数据建模
  • 5.3.1 数据发现
  • 5.3.2 数据学习
  • 5.4 信息萃取
  • 5.4.1 数据产品创建
  • 5.4.2 知识、交付物与可视化产品
  • 5.5 保持开放型思维
  • 5.6 在实际问题中应用数据科学流程
  • 5.6.1 数据准备
  • 5.6.2 数据探索
  • 5.6.3 数据表示
  • 5.6.4 数据发现
  • 5.6.5 数据学习
  • 5.6.6 数据产品创建
  • 5.6.7 知识、交付物和可视化产品
  • 5.7 小结
  • 5.8 思考题
  • 第6章 Julia数据工程
  • 6.1 数据框
  • 6.1.1 创建并填充数据框
  • 6.1.2 数据框基础
  • 6.1.3 引用数据框中的特定变量
  • 6.1.4 探索数据框
  • 6.1.5 筛选数据框
  • 6.1.6 在数据框变量上应用函数
  • 6.1.7 使用数据框进行工作
  • 6.1.8 修改数据框
  • 6.1.9 对数据框的内容进行排序
  • 6.1.10 数据框的一些补充建议
  • 6.2 导入与导出数据
  • 6.2.1 使用.json数据文件
  • 6.2.2 保存数据到.json文件
  • 6.2.3 将数据文件加载到数据框
  • 6.2.4 保存数据框到数据文件
  • 6.3 数据清洗
  • 6.3.1 数值型数据的清洗
  • 6.3.2 文本型数据的清洗
  • 6.4 数据格式化与转换
  • 6.4.1 数值型数据的格式化
  • 6.4.2 文本数据的格式化
  • 6.4.3 数据类型的重要性
  • 6.5 对数值型数据进行转换
  • 6.5.1 标准化
  • 6.5.2 离散化(分箱)与二值化
  • 6.5.3 二值变量转换为连续型变量(仅对于二值分类问题)
  • 6.5.4 文本数据转换
  • 6.5.5 大小写标准化
  • 6.5.6 向量化
  • 6.6 初步的特征评价
  • 6.6.1 回归
  • 6.6.2 分类
  • 6.6.3 特征评价补充说明
  • 6.7 小结
  • 6.8 思考题
  • 第7章 探索数据集
  • 7.1 倾听数据
  • 本章要使用的扩展包
  • 7.2 计算基本统计量和相关性
  • 7.2.1 变量概要
  • 7.2.2 变量之间的相关性
  • 7.2.3 两个变量之间的可比性
  • 7.3 绘制统计图
  • 7.3.1 图形语法
  • 7.3.2 为可视化准备数据
  • 7.3.3 箱线图
  • 7.3.4 条形图
  • 7.3.5 折线图
  • 7.3.6 散点图
  • 7.3.7 直方图
  • 7.3.8 导出统计图到文件
  • 7.4 假设检验
  • 7.4.1 检验的基础知识
  • 7.4.2 错误类型
  • 7.4.3 灵敏度与特异度
  • 7.4.4 显著性水平与检验力
  • 7.4.5 KRUSKAL-WALLIS检验
  • 7.4.6 T-检验
  • 7.4.7 卡方检验
  • 7.5 其他检验
  • 7.6 统计检验附加说明
  • 7.7 案例研究:探索OnlineNewsPopularity数据集
  • 7.7.1 变量统计
  • 7.7.2 可视化
  • 7.7.3 假设
  • 7.7.4 奇妙的T-SNE方法
  • 7.7.5 结论
  • 7.8 小结
  • 7.9 思考题
  • 第8章 构建数据空间
  • 8.1 主成分分析
  • 8.1.1 在Julia中使用PCA
  • 8.1.2 独立成分分析:主成分分析的最常用替代方法
  • 8.2 特征评价与选择
  • 8.2.1 方法论概述
  • 8.2.2 在Julia中使用余弦相似度进行特征评价与选择
  • 8.2.3 在Julia中使用DID进行特征评价与选择
  • 8.2.4 特征评价与选择方法的优缺点
  • 8.3 其他数据降维技术
  • 8.3.1 其他降维方法概述
  • 8.3.2 何时使用高级降维方法
  • 8.4 小结
  • 8.5 思考题
  • 第9章 数据抽样与结果评价
  • 9.1 抽样技术
  • 9.1.1 基本抽样
  • 9.1.2 分层抽样
  • 9.2 分类问题的性能指标
  • 9.2.1 混淆矩阵
  • 9.2.2 准确度
  • 9.2.3 精确度与召回度
  • 9.2.4 F1指标
  • 9.2.5 误判成本
  • 9.2.6 受试者工作特征(ROC)曲线及相关指标
  • 9.3 回归问题的性能指标
  • 9.3.1 MSE及其变种RMSE
  • 9.3.2 SSE
  • 9.3.3 其他指标
  • 9.4 K折交叉验证(KFCV)
  • 9.4.1 在Julia中应用KFCV
  • 9.4.2 KFCV小提示
  • 9.5 小结
  • 9.6 思考题
  • 第10章 无监督式机器学习
  • 10.1 无监督式学习基础知识
  • 10.1.1 聚类的类型
  • 10.1.2 距离的度量
  • 10.2 使用K-均值算法分组数据
  • 10.2.1 使用Julia实现K-均值聚类
  • 10.2.2 对K-均值算法的使用建议
  • 10.3 密度和DBSCAN算法
  • 10.3.1 DBSCAN算法
  • 10.3.2 在Julia中应用DBSCAN
  • 10.4 层次聚类
  • 10.4.1 在Julia中使用层次聚类
  • 10.4.2 何时使用层次聚类
  • 10.5 聚类的验证方式
  • 10.5.1 Silhouettes
  • 10.5.2 关于聚类验证的一些建议
  • 10.6 关于有效进行聚类的一些建议
  • 10.6.1 处理高维数据
  • 10.6.2 标准化
  • 10.6.3 可视化建议
  • 10.7 小结
  • 10.8 思考题
  • 第11章 监督式机器学习
  • 11.1 决策树
  • 11.1.1 在Julia中使用决策树
  • 11.1.2 关于决策树的一些建议
  • 11.2 回归树
  • 11.2.1 在Julia中实现回归树
  • 11.2.2 关于回归树的一些建议
  • 11.3 随机森林
  • 11.3.1 在Julia中使用随机森林进行分类
  • 11.3.2 在Julia中使用随机森林进行回归
  • 11.3.3 关于随机森林的一些建议
  • 11.4 基本神经网络
  • 11.4.1 在Julia中使用神经网络
  • 11.4.2 关于神经网络的一些建议
  • 11.5 极限学习机
  • 11.5.1 在Julia中使用ELM
  • 11.5.2 关于ELM的一些建议
  • 11.6 用于回归分析的统计模型
  • 11.6.1 在Julia中使用统计回归
  • 11.6.2 关于统计回归的一些建议
  • 11.7 其他监督式学习系统
  • 11.7.1 提升树
  • 11.7.2 支持向量机
  • 11.7.3 直推式系统
  • 11.7.4 深度学习系统
  • 11.7.5 贝叶斯网络
  • 11.8 小结
  • 11.9 本章思考题
  • 第12章 图分析
  • 12.1 图的重要性
  • 12.2 定制数据集
  • 12.3 图的统计量
  • 12.4 环的检测
  • 用Julia检测环
  • 12.5 连通子图
  • 12.6 团
  • 12.7 图的最短路径
  • 12.8 最小生成树
  • 12.8.1 在Julia中实现MST
  • 12.8.2 用文件保存和加载图
  • 12.9 Julia在图分析中的作用
  • 12.10 小结
  • 12.11 思考题
  • 第13章 更上一层楼
  • 13.1 Julia社区
  • 13.1.1 与其他Julia用户进行交流
  • 13.1.2 代码库
  • 13.1.3 视频文件
  • 13.1.4 新闻
  • 13.2 学以致用
  • 13.2.1 从这些特征开始
  • 13.2.2 关于这个项目的一些思考
  • 13.3 在数据科学中使用Julia的最后思考
  • 13.3.1 不断提高Julia编程水平
  • 13.3.2 贡献Julia项目
  • 13.3.3 Julia在数据科学中的未来
  • 附录A 下载安装Julia与IJulia
  • 附录B 与Julia相关的一些常用站点
  • 附录C 本书所用的扩展包
  • 附录D Julia与其他平台的集成
  • D.1 Julia与R的集成
  • D.1.1 在R中运行Julia脚本
  • D.1.2 在Julia中运行R脚本
  • D.2 Julia与Python的集成
  • D.2.1 在Python中运行Julia脚本
  • D.2.2 在Julia中运行Python脚本
  • 附录E Julia中的并行处理
  • 附录F 各章思考题答案
  • 欢迎来到异步社区!
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。