展开全部

主编推荐语

本书能带你学到数据处理中的实用技术,还能培养在数据分析中的探索性思维。

内容简介

R语言在近10年来已经发生了日新月异的变化,不仅在内容上更加丰富多彩,而且在计算效率上也有了大幅的提升。它被更加广泛地用于数据可视化、统计建模、机器学习等领域,而且还能实现网络爬虫、网络应用开发等功能,成为数据科学领域的全能型工具。R语言在学术界的地位已经不容置疑,在大数据时代中它是保证研究可重复性的重要工具。随着功能的日益完善,R语言已经进军工业界,并在金融、保险、医疗、生物和信息计量等不同的应用场景中大放异彩,潜力不可估量。尽管R语言能够实现丰富多样的实际功能和框架,但是其本质是面向数据的,因此数据处理是R语言核心中的核心。如果能够掌握高效的数据操作技术,就能够在各类数据分析任务中如鱼得水。本书定位即为“R语言数据处理101”,希望R语言的使用者能够在较早的阶段就习得基本而有效的数据处理基本技术。

目录

  • 版权信息
  • 内容提要
  • 前言
  • 第1部分 基础知识
  • 第1章 数据处理总论
  • 1.1 数据处理的定义
  • 1.2 数据处理的意义
  • 1.3 数据处理基本工具
  • 第2章 R语言编程基础
  • 2.1 下载安装
  • 2.2 包的使用
  • 2.3 数据类型
  • 2.4 数据结构
  • 2.5 程序控制
  • 2.6 函数式编程
  • 第3章 数据处理基本范式
  • 第2部分 快速入门
  • 第4章 base-r:基本数据处理
  • 4.1 数据集及其基本探索
  • 4.2 基本范式实现
  • 第5章 tidyverse生态系统:简洁高效数据处理
  • 5.1 tidyverse生态系统简介
  • 5.2 基本范式实现
  • 5.3 高级处理工具
  • 第3部分 高级进阶
  • 第6章 data.table:高速数据处理
  • 6.1 data.table简介
  • 6.2 基本范式实现
  • 6.3 高级特性探索
  • 第7章 sparklyr: 分布式数据处理
  • 7.1 连接R与Spark:sparklyr包简介
  • 7.2 基本操作指南
  • 7.3 存储机制简介
  • 7.4 分布式计算
  • 第4部分 实战应用
  • 第8章 航班飞行数据演练
  • 8.1 nycflights13数据集探索
  • 8.2 flights14数据集探索
  • 第9章 测试
  • 第10章 实用数据处理技巧
  • 10.1 数据存取
  • 10.2 并行计算(doParallel)
  • 10.3 混合编程
  • 第11章 实战案例:网络爬虫与文本挖掘
  • 11.1 网络爬取(rvest)
  • 11.2 文本挖掘(tidytext)
  • 第12章 实战案例:数据塑型与可视化(ggplot2)
  • 12.1 数据准备
  • 12.2 柱状图(geom_bar)
  • 12.3 折线图(geom_line)
  • 12.4 饼图(ggpie)
  • 12.5 一行代码实现一页多图(gridExtra)
  • 第13章 实战案例:机器学习
  • 13.1 机器学习概述
  • 13.2 为什么要做机器学习
  • 13.3 如何入门机器学习
  • 13.4 数据处理与机器学习
  • 13.5 案例分析:信贷风险预测模型构建
  • 致谢
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

北京大学出版社

北京大学出版社是在1979年,经国家出版事业管理局同意,教育部批准成立的,恢复了北京大学出版社建制。北京大学出版社依靠北大雄厚的教学、科研力量,同时积极争取国内外专家学者的合作支持,出版了大量高水平、高质量、适应多层次需要的优秀高等教育教材。 北大出版社注意对教材进行全面追踪,捕捉信息,及时修订,以跟上各学科的最新发展,反映该学科研究的最新成果,保持北大版教材的领先地位。