互联网
类型
可以朗读
语音朗读
115千字
字数
2024-12-01
发行日期
展开全部
主编推荐语
一本R语言入门读物。
内容简介
如何从数据中挖掘价值?一是要锻炼数据思维;二是需要选择一个便利快捷的工具。
R语言在数据分析方面有着灵活、高效的优势。本书以R语言为基础,深度讲解从数据思维到实战的全过程。在章节组织上,本书从R语言简介及优势入手,再到数据读取、清洗、描述、建模等数据分析的各个环节,由浅入深逐个讲解,是一本实务分析中的“R语言指南”。同时,书中采用大量实际案例辅以说明,既有助于上手分析,也可用于教学使用。
目录
- 版权信息
- 推荐序一
- 推荐序二
- 前言
- 第1章 初识R语言
- 1.1 初识R语言
- 1.1.1 R语言是什么?
- 1.1.2 为什么要使用R语言?
- 1.1.3 R语言的其他技能
- 1.2 安装R语言
- 1.2.1 R的获取和安装
- 1.2.2 R的升级版武器:RStudio介绍
- 1.2.3 R包的获取与安装
- 1.3 获取R帮助文档
- 1.3.1 在RStudio中看Help
- 1.3.2 学会使用搜索引擎
- 1.3.3 求助于开源社区、论坛
- 1.3.4 社区提问的技巧
- 第2章 R语言数据操作
- 2.1 R中的数据类型
- 2.1.1 基本数据类型
- 2.1.2 向量
- 2.1.3 矩阵
- 2.1.4 数据框
- 2.1.5 列表
- 2.2 数据读入
- 2.2.1 结构化数据读入
- 2.2.2 非结构化数据——文本数据读入
- 第3章 R语言与统计分析
- 3.1 描述分析及可视化
- 3.1.1 基础描述分析
- 3.1.2 ggplot2绘图
- 3.1.3 交互数据可视化
- 3.2 统计检验
- 3.2.1 单个总体均值的t检验
- 3.2.2 两总体均值对比
- 3.3 回归分析
- 3.3.1 线性回归
- 3.3.2 逻辑回归
- 3.4 代码规范与文档撰写
- 3.4.1 R语言代码规范
- 3.4.2 R Markdown文档撰写
- 第4章 R语言与非结构化数据分析
- 4.1 文本分析
- 4.1.1 简单文本——词语
- 4.1.2 难度升级——处理长难句
- 4.1.3 小说文本
- 4.2 图像分析
- 4.2.1 熊大图像处理
- 4.2.2 看图识雾霾
- 第5章 R语言与机器学习
- 5.1 机器学习概述
- 5.1.1 读入数据
- 5.1.2 数据预处理及数据分割
- 5.1.3 特征选择
- 5.1.4 模型训练
- 5.1.5 模型预测集评估
- 5.2 数据预处理
- 5.2.1 读入数据
- 5.2.2 分割训练集和测试集
- 5.2.3 处理缺失值
- 5.2.4 删除近零方差
- 5.2.5 删除共线性变量
- 5.2.6 标准化
- 5.3 模型训练与调参
- 5.3.1 模型调参
- 5.3.2 模型预测
- 5.4 模型训练与集成
- 5.4.1 逻辑回归
- 5.4.2 决策树
- 5.4.3 随机森林
- 5.4.4 模型集成
- 第6章 R语言爬虫初介
- 6.1 HTML基础与R语言解析
- 6.1.1 HTML的语法规则
- 6.1.2 R语言中HTML的解析
- 6.2 XML与XPath表达式以及R爬虫应用
- 6.2.1 XML
- 6.2.2 如何在R语言中解析XML
- 6.2.3 XPath表达式
- 6.2.4 SelectorGadget自动生成XPath表达式
- 6.3 HTTP协议
- 6.3.1 访问NBA中国官方网站主页
- 6.3.2 URL语法
- 6.3.3 HTTP消息
- 6.4 AJAX与网页动态加载
- 6.4.1 从HTML到DHTML
- 6.4.2 网页动态加载中数据的获取机制
- 6.4.3 使用Web开发者工具辅助动态爬取
- 6.5 正则表达式与字符串处理函数
- 6.5.1 基本的正则表达式语法
- 6.5.2 R中正则表达式的使用方法
- 6.6 R语言爬虫实战
- 6.6.1 静态网页数据抓取利器——rvest
- 6.6.2 httr包实现对网页动态加载数据的抓取
展开全部
出版方
中国人民大学出版社
中国人民大学出版社成立于1955年,是新中国建立后成立的第一家大学出版社。时光在文字与光阴中驻足,我们在积聚书香与赓续文脉之时,也有一点小小的向往,在徜徉中拢住自我与他者的目光,给天下读书人一点点温暖。