展开全部

主编推荐语

这本书选取了机器学习和深度学习两大热门领域的核心内容,为读者进一步实现数据价值的深度分析和挖掘打下坚实基础。

内容简介

本书首先介绍了数据工程和Python语法,随后讲解如何获取和存储数据,并实现简单的静态可视化。文本作为一种极其重要的数据类型,也单独列出一章进行讨论。之后读者将学习到关于Web建站的一些基础和进阶知识,并基于多种工具完成丰富的动态可视化。

目录

  • 版权信息
  • 内容提要
  • 前言
  • 第1章 写在前面
  • 1.1 数据工程和编程语言
  • 1.1.1 如何玩转数据
  • 1.1.2 关于编程语言
  • 1.2 带好装备——Python和Sublime
  • 1.2.1 Python
  • 1.2.2 Sublime
  • 1.2.3 运行Python代码的方法
  • 1.2.4 Hello World
  • 1.3 数据结构和常见类型
  • 1.3.1 数据的结构
  • 1.3.2 数据的类型
  • 第2章 学会Python
  • 2.1 Python基础语法
  • 2.1.1 Python的特点
  • 2.1.2 中文编码
  • 2.1.3 变量
  • 2.1.4 注释
  • 2.1.5 保留名
  • 2.1.6 行和缩进
  • 2.1.7 运算符
  • 2.1.8 条件
  • 2.1.9 循环
  • 2.1.10 时间
  • 2.1.11 文件
  • 2.1.12 异常
  • 2.1.13 函数
  • 2.1.14 补充内容
  • 2.2 实战:西游记用字统计
  • 2.2.1 数据
  • 2.2.2 目标
  • 2.2.3 步骤
  • 2.2.4 总结
  • 第3章 获取数据
  • 3.1 HTTP请求和Chrome
  • 3.1.1 访问一个链接
  • 3.1.2 Chrome浏览器
  • 3.1.3 HTTP
  • 3.1.4 URL类型
  • 3.2 使用Python获取数据
  • 3.2.1 urllib2
  • 3.2.2 GET请求
  • 3.2.3 POST请求
  • 3.2.4 处理返回结果
  • 3.3 实战:爬取豆瓣电影
  • 3.3.1 确定目标
  • 3.3.2 通用思路
  • 3.3.3 寻找链接
  • 3.3.4 代码实现
  • 3.3.5 补充内容
  • 第4章 存储数据
  • 4.1 使用XAMP搭建Web环境
  • 4.1.1 Web环境
  • 4.1.2 偏好设置
  • 4.1.3 Hello World
  • 4.2 MySQL使用方法
  • 4.2.1 基本概念
  • 4.2.2 命令行
  • 4.2.3 Web工具
  • 4.2.4 本地软件
  • 4.3 使用Python操作数据库
  • 4.3.1 MySQLdb
  • 4.3.2 建立连接
  • 4.3.3 执行操作
  • 4.3.4 关闭连接
  • 4.3.5 扩展内容
  • 第5章 静态可视化
  • 5.1 在R中进行可视化
  • 5.1.1 下载和安装
  • 5.1.2 R语言基础
  • 5.1.3 ggplot2
  • 5.1.4 R语言学习笔记
  • 5.2 掌握ggplot2数据可视化
  • 5.2.1 图形种类
  • 5.2.2 基本语法
  • 5.2.3 条形图
  • 5.2.4 折线图
  • 5.2.5 描述数据分布
  • 5.2.6 分面
  • 5.2.7 R语言数据可视化
  • 5.3 实战:Diamonds数据集探索
  • 5.3.1 查看数据
  • 5.3.2 价格和克拉
  • 5.3.3 价格分布
  • 5.3.4 纯净度分布
  • 5.3.5 价格概率分布
  • 5.3.6 不同切工下的价格分布
  • 5.3.7 坐标变换
  • 5.3.8 标题和坐标轴标签
  • 第6章 自然语言理解
  • 6.1 走近自然语言理解
  • 6.1.1 概念
  • 6.1.2 内容
  • 6.1.3 应用
  • 6.2 使用jieba分词处理中文
  • 6.2.1 jieba中文分词
  • 6.2.2 中文分词
  • 6.2.3 关键词提取
  • 6.2.4 词性标注
  • 6.3 词嵌入的概念和实现
  • 6.3.1 语言的表示
  • 6.3.2 训练词向量
  • 6.3.3 代码实现
  • 第7章 Web基础
  • 7.1 网页的骨骼:HTML
  • 7.1.1 HTML是什么
  • 7.1.2 基本结构
  • 7.1.3 常用标签
  • 7.1.4 标签的属性
  • 7.1.5 注释
  • 7.1.6 表单
  • 7.1.7 颜色
  • 7.1.8 DOM
  • 7.1.9 HTML5
  • 7.1.10 补充内容
  • 7.2 网页的血肉:CSS
  • 7.2.1 CSS是什么
  • 7.2.2 基本结构
  • 7.2.3 使用CSS
  • 7.2.4 常用选择器
  • 7.2.5 常用样式
  • 7.2.6 CSS3
  • 7.2.7 CSS实例
  • 7.2.8 补充学习
  • 7.3 网页的关节:JS
  • 7.3.1 JS是什么
  • 7.3.2 使用JS
  • 7.3.3 JS基础
  • 7.3.4 补充学习
  • 第8章 Web进阶
  • 8.1 比JS更方便的JQuery
  • 8.1.1 引入JQuery
  • 8.1.2 语法
  • 8.1.3 选择器
  • 8.1.4 事件
  • 8.1.5 直接操作
  • 8.1.6 AJAX请求
  • 8.1.7 补充学习
  • 8.2 实战:你竟是这样的月饼
  • 8.2.1 项目简介
  • 8.2.2 首页实现
  • 8.2.3 月饼页实现
  • 8.2.4 项目总结
  • 8.3 基于ThinkPHP的简易个人博客
  • 8.3.1 ThinkPHP是什么
  • 8.3.2 个人博客
  • 8.3.3 下载和初始化
  • 8.3.4 MVC
  • 8.3.5 数据库配置
  • 8.3.6 控制器、函数和渲染模板
  • 8.3.7 U函数和页面跳转
  • 8.3.8 表单实现和数据处理
  • 8.3.9 读取数据并渲染
  • 8.3.10 项目总结
  • 8.4 基于Flask的简易个人博客
  • 8.4.1 Flask是什么
  • 8.4.2 项目准备
  • 8.4.3 渲染模板
  • 8.4.4 操作数据库
  • 8.4.5 完善其他页面
  • 8.4.6 项目总结
  • 第9章 动态可视化
  • 9.1 使用ECharts制作交互图形
  • 9.1.1 ECharts是什么
  • 9.1.2 引入Echarts
  • 9.1.3 准备一个画板
  • 9.1.4 绘制ECharts图形
  • 9.1.5 使用其他主题
  • 9.1.6 配置项手册
  • 9.1.7 开始探索
  • 9.2 实战:再谈豆瓣电影数据分析
  • 9.2.1 项目成果
  • 9.2.2 数据获取
  • 9.2.3 数据清洗和存储
  • 9.2.4 数据分析
  • 9.2.5 数据可视化
  • 9.2.6 项目总结
  • 9.3 数据可视化之魅D3
  • 9.3.1 D3是什么
  • 9.3.2 D3核心思想
  • 9.3.3 一个简单的例子
  • 9.3.4 深入理解D3
  • 9.3.5 开始探索
  • 9.4 实战:星战电影知识图谱
  • 9.4.1 项目成果
  • 9.4.2 数据获取
  • 9.4.3 数据分析
  • 9.4.4 数据可视化
  • 9.4.5 项目总结
  • 9.5 艺术家爱用的Processing
  • 9.5.1 Processing是什么
  • 9.5.2 一个简单的例子
  • 9.5.3 Processing基础
  • 9.5.4 更多内容
  • 9.6 实战:上海地铁的一天
  • 9.6.1 项目成果
  • 9.6.2 项目数据
  • 9.6.3 项目思路
  • 9.6.4 项目实现
  • 9.6.5 项目总结
  • 第10章 机器学习
  • 10.1 明白一些基本概念
  • 10.1.1 机器学习是什么
  • 10.1.2 学习的种类
  • 10.1.3 两大痛点
  • 10.1.4 学习的流程
  • 10.1.5 代码实现
  • 10.2 常用经典模型及实现
  • 10.2.1 线性回归
  • 10.2.2 Logistic回归
  • 10.2.3 贝叶斯
  • 10.2.4 K近邻
  • 10.2.5 决策树
  • 10.2.6 支持向量机
  • 10.2.7 K-Means
  • 10.2.8 神经网络
  • 10.2.9 代码实现
  • 10.3 调参比赛大杀器XGBoost
  • 10.3.1 为什么要调参
  • 10.3.2 XGBoost是什么
  • 10.3.3 XGBoost安装
  • 10.3.4 XGBoost模型参数
  • 10.3.5 XGBoost调参实战
  • 10.3.6 总结
  • 10.4 实战:微额借款用户人品预测
  • 10.4.1 项目背景
  • 10.4.2 数据概况
  • 10.4.3 缺失值处理
  • 10.4.4 特征工程
  • 10.4.5 特征选择
  • 10.4.6 模型设计
  • 10.4.7 项目总结
  • 第11章 深度学习
  • 11.1 初探Deep Learning
  • 11.1.1 深度学习是什么
  • 11.1.2 神经元模型
  • 11.1.3 全连接层
  • 11.1.4 代码实现
  • 11.2 用于处理图像的CNN
  • 11.2.1 CNN是什么
  • 11.2.2 CNN核心内容
  • 11.2.3 CNN使用方法
  • 11.2.4 CNN模型训练
  • 11.2.5 代码实现
  • 11.3 用于处理序列的RNN
  • 11.3.1 RNN是什么
  • 11.3.2 RNN模型结构
  • 11.3.3 LSTM
  • 11.3.4 RNN使用方法
  • 11.3.5 代码实现
  • 11.4 实战:多种手写数字识别模型
  • 11.4.1 手写数字数据集
  • 11.4.2 全连接层
  • 11.4.3 CNN实现
  • 11.4.4 RNN实现
  • 11.4.5 实战总结
  • 第12章 数据的故事
  • 12.1 如何讲一个好的故事
  • 12.1.1 为什么要做PPT
  • 12.1.2 讲一个好的故事
  • 12.1.3 用颜值加分
  • 12.1.4 总结
  • 12.2 实战:有内容有颜值的分享
  • 12.2.1 SODA
  • 12.2.2 公益云图
  • 12.2.3 上海BOT
  • 12.2.4 总结
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。