5.0 用户推荐指数
互联网
类型
可以朗读
语音朗读
248千字
字数
2020-11-01
发行日期
展开全部
主编推荐语
揭秘Python爬虫的行业实战应用,讲解大数据分析与可视化的典型技术。
内容简介
Python语言功能强大而灵活,具有很强的扩展性,同时它的语法又相对简洁易懂,没有编程基础的普通办公人员经过适当的学习也能轻松上手。本书以Python语言为工具,从编程新手的角度和日常办公的需求出发,深入浅出地讲解如何通过Python编程高效地完成数据的获取、处理、分析与可视化。
全书共13章:
第1章和第2章主要讲解Python编程环境的搭建和Python语言的基础语法知识;
第3~6章以数据处理与分析为主题,讲解NumPy模块和pandas模块的基本用法和实际应用;
第7~9章以数据获取为主题,由浅入深地讲解如何通过编写爬虫程序从网页上采集数据,并保存到数据库中;
第10章主要讲解自然语言处理技术在文本分词中的应用;
第11章和第12章以数据可视化为主题,讲解如何使用Matplotlib模块和pyecharts模块绘制图表;
第13章通过量化金融案例对前面所学的知识进行了综合应用。
目录
- 版权信息
- 前言
- 如何获取学习资源
- 第1章 Python快速上手
- 1.1 Python编程环境的搭建
- 1.2 Python的模块
- 1.2.1 初识模块
- 1.2.2 模块的安装
- 第2章 Python的基础语法知识
- 2.1 变量
- 2.2 数据类型:数字与字符串
- 2.2.1 数字
- 2.2.2 字符串
- 2.2.3 数据类型的查询
- 2.2.4 数据类型的转换
- 2.3 数据类型:列表、字典、元组与集合
- 2.3.1 列表
- 2.3.2 字典
- 2.3.3 元组和集合
- 2.4 运算符
- 2.4.1 算术运算符和字符串运算符
- 2.4.2 比较运算符
- 2.4.3 赋值运算符
- 2.4.4 逻辑运算符
- 2.5 编码基本规范
- 2.5.1 缩进
- 2.5.2 注释
- 2.6 控制语句
- 2.6.1 if语句
- 2.6.2 for语句
- 2.6.3 while语句
- 2.6.4 控制语句的嵌套
- 2.7 函数
- 2.7.1 内置函数
- 2.7.2 自定义函数
- 2.8 模块的导入
- 2.8.1 import语句导入法
- 2.8.2 from语句导入法
- 第3章 数组的存储和处理——NumPy模块
- 3.1 创建数组
- 3.1.1 使用array()函数创建数组
- 3.1.2 创建等差数组
- 3.1.3 创建随机数组
- 3.2 查看数组的属性
- 3.3 选取数组元素
- 3.3.1 一维数组的元素选取
- 3.3.2 二维数组的元素选取
- 3.4 数组的重塑与转置
- 3.4.1 一维数组的重塑
- 3.4.2 多维数组的重塑
- 3.4.3 数组的转置
- 3.5 数组的处理
- 3.5.1 添加数组元素
- 3.5.2 删除数组元素
- 3.5.3 处理数组的缺失值
- 3.5.4 处理数组的重复值
- 3.5.5 拼接数组
- 3.5.6 拆分数组
- 3.6 数组的运算
- 3.6.1 数组之间的四则运算
- 3.6.2 数组元素的统计运算
- 第4章 数据的简单处理——pandas模块入门
- 4.1 数据结构
- 4.1.1 Series对象
- 4.1.2 DataFrame对象
- 4.2 读取数据
- 4.2.1 读取Excel工作簿数据
- 4.2.2 读取csv文件数据
- 4.3 查看数据
- 4.3.1 查看数据的前几行
- 4.3.2 查看数据的行数和列数
- 4.3.3 查看数据的类型
- 4.4 选择数据
- 4.4.1 选择行数据
- 4.4.2 选择列数据
- 4.4.3 同时选择行列数据
- 4.5 修改行标签和列标签
- 第5章 数据的高级处理——pandas模块进阶
- 5.1 数据的查找和替换
- 5.1.1 查找数据
- 5.1.2 替换数据
- 5.2 数据的处理
- 5.2.1 插入数据
- 5.2.2 删除数据
- 5.2.3 处理缺失值
- 5.2.4 处理重复值
- 5.2.5 排序数据
- 5.2.6 筛选数据
- 5.3 数据表的处理
- 5.3.1 转置数据表的行列
- 5.3.2 将数据表转换为树形结构
- 5.3.3 数据表的拼接
- 5.4 数据的运算
- 5.4.1 数据的统计运算
- 5.4.2 获取数值分布情况
- 5.4.3 计算相关系数
- 5.4.4 分组汇总数据
- 5.4.5 创建数据透视表
- 5.5 案例:获取并分析股票历史数据
- 第6章 使用Python进行数据分析
- 6.1 相关性分析
- 6.1.1 获取股价数据
- 6.1.2 合并股价数据
- 6.1.3 股价数据相关性分析
- 6.2 假设检验
- 6.3 方差分析
- 6.3.1 方差分析的基本步骤
- 6.3.2 单因素方差分析的代码实现
- 6.3.3 双因素方差分析的代码实现
- 6.3.4 利用第三方模块快速完成方差分析
- 6.4 描述性统计分析
- 6.4.1 描述性统计指标的计算
- 6.4.2 数据的分布状态分析
- 6.4.3 数据的频数和频率分析
- 6.5 线性回归分析
- 6.5.1 线性回归分析的数学原理
- 6.5.2 线性回归分析的思路
- 6.5.3 广告费与销量的一元线性回归分析
- 6.5.4 不同渠道的广告费与销量的多元线性回归分析
- 第7章 Python爬虫基础
- 7.1 认识网页结构
- 7.1.1 查看网页的源代码
- 7.1.2 网页结构的组成
- 7.1.3 百度新闻页面结构剖析
- 7.2 requests模块
- 7.2.1 requests模块获取数据的方式
- 7.2.2 get()函数的参数介绍
- 7.3 案例:爬取豆瓣电影动画排行榜
- 7.4 正则表达式
- 7.4.1 正则表达式基础
- 7.4.2 用正则表达式提取数据
- 7.5 BeautifulSoup模块
- 7.5.1 实例化BeautifulSoup对象
- 7.5.2 用BeautifulSoup对象定位标签
- 7.5.3 从标签中提取文本内容和属性值
- 7.6 XPath表达式
- 7.6.1 实例化etree对象
- 7.6.2 用XPath表达式定位标签并提取数据
- 7.6.3 快速获取标签节点的XPath表达式
- 7.7 数据清洗
- 7.8 案例:爬取当当网的图书销售排行榜
- 第8章 Python爬虫进阶
- 8.1 Selenium模块基础
- 8.1.1 Selenium模块的安装与基本用法
- 8.1.2 Selenium模块的标签定位
- 8.1.3 Selenium模块的标签操作
- 8.2 Selenium模块进阶
- 8.2.1 模拟鼠标操作
- 8.2.2 <iframe>标签处理
- 8.2.3 显式等待和隐式等待
- 8.3 案例:模拟登录12306
- 8.4 IP反爬的应对
- 8.4.1 IP反爬的应对思路
- 8.4.2 搭建代理IP池
- 8.4.3 实战案例
- 8.5 用cookie池模拟登录
- 8.5.1 用浏览器获取cookie信息
- 8.5.2 自动记录cookie信息
- 8.5.3 cookie池的搭建和使用
- 8.6 提高爬虫程序的数据爬取效率
- 8.6.1 多进程实现并行
- 8.6.2 进程池的创建
- 8.6.3 多线程实现并发
- 8.6.4 线程池的创建
- 8.6.5 多任务异步协程实现并发
- 8.6.6 多进程、多线程和多任务异步协程在爬虫中的应用
- 第9章 表格数据获取与数据库详解
- 9.1 表格类数据的获取
- 9.1.1 用于构建表格的标签
- 9.1.2 read_html()函数的基本用法
- 9.2 用数据库存取数据
- 9.2.1 数据库概述
- 9.2.2 MySQL的安装和配置
- 9.2.3 数据表的基本操作
- 9.2.4 数据表中数据的基本操作
- 9.2.5 用PyMySQL模块操作数据库
- 9.2.6 用pandas模块操作数据库
- 9.3 案例:爬取58同城租房信息
- 第10章 自然语言处理
- 10.1 NLP概述
- 10.1.1 NLP的应用领域和基本流程
- 10.1.2 文本分词方法
- 10.2 jieba分词器
- 10.2.1 jieba分词器的基础知识
- 10.2.2 jieba分词器的基本用法
- 10.2.3 调整词典
- 10.2.4 关键词提取
- 10.2.5 停用词过滤
- 10.2.6 词频统计
- 10.3 案例:新闻关键词的提取与汇总
- 第11章 数据可视化——Matplotlib模块
- 11.1 绘制基本图表
- 11.1.1 绘制柱形图
- 11.1.2 绘制条形图
- 11.1.3 绘制折线图
- 11.1.4 绘制面积图
- 11.1.5 绘制散点图
- 11.1.6 绘制饼图和圆环图
- 11.2 图表的绘制和美化技巧
- 11.2.1 在一张画布中绘制多个图表
- 11.2.2 添加图表元素
- 11.2.3 添加并设置网格线
- 11.2.4 调整坐标轴的刻度范围
- 11.3 绘制高级图表
- 11.3.1 绘制气泡图
- 11.3.2 绘制组合图
- 11.3.3 绘制直方图
- 11.3.4 绘制雷达图
- 11.3.5 绘制树状图
- 11.3.6 绘制箱形图
- 11.3.7 绘制玫瑰图
- 第12章 数据可视化神器——pyecharts模块
- 12.1 图表配置项
- 12.2 绘制漏斗图
- 12.3 绘制涟漪特效散点图
- 12.4 绘制水球图
- 12.5 绘制仪表盘
- 12.6 绘制词云图
- 12.7 绘制K线图
- 第13章 量化金融——股票信息挖掘与分析
- 13.1 案例介绍
- 13.2 获取汽车行业股票的基本信息
- 13.3 获取单只股票的历史行情数据
- 13.4 获取沪深A股涨幅前60名的信息
- 13.5 计算股票的月涨跌幅
- 13.6 股票相关性分析
- 13.7 股票价格预测
展开全部
出版方
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。