展开全部

主编推荐语

揭秘Python爬虫的行业实战应用,讲解大数据分析与可视化的典型技术。

内容简介

Python语言功能强大而灵活,具有很强的扩展性,同时它的语法又相对简洁易懂,没有编程基础的普通办公人员经过适当的学习也能轻松上手。本书以Python语言为工具,从编程新手的角度和日常办公的需求出发,深入浅出地讲解如何通过Python编程高效地完成数据的获取、处理、分析与可视化。

全书共13章:

第1章和第2章主要讲解Python编程环境的搭建和Python语言的基础语法知识;

第3~6章以数据处理与分析为主题,讲解NumPy模块和pandas模块的基本用法和实际应用;

第7~9章以数据获取为主题,由浅入深地讲解如何通过编写爬虫程序从网页上采集数据,并保存到数据库中;

第10章主要讲解自然语言处理技术在文本分词中的应用;

第11章和第12章以数据可视化为主题,讲解如何使用Matplotlib模块和pyecharts模块绘制图表;

第13章通过量化金融案例对前面所学的知识进行了综合应用。

目录

  • 版权信息
  • 前言
  • 如何获取学习资源
  • 第1章 Python快速上手
  • 1.1 Python编程环境的搭建
  • 1.2 Python的模块
  • 1.2.1 初识模块
  • 1.2.2 模块的安装
  • 第2章 Python的基础语法知识
  • 2.1 变量
  • 2.2 数据类型:数字与字符串
  • 2.2.1 数字
  • 2.2.2 字符串
  • 2.2.3 数据类型的查询
  • 2.2.4 数据类型的转换
  • 2.3 数据类型:列表、字典、元组与集合
  • 2.3.1 列表
  • 2.3.2 字典
  • 2.3.3 元组和集合
  • 2.4 运算符
  • 2.4.1 算术运算符和字符串运算符
  • 2.4.2 比较运算符
  • 2.4.3 赋值运算符
  • 2.4.4 逻辑运算符
  • 2.5 编码基本规范
  • 2.5.1 缩进
  • 2.5.2 注释
  • 2.6 控制语句
  • 2.6.1 if语句
  • 2.6.2 for语句
  • 2.6.3 while语句
  • 2.6.4 控制语句的嵌套
  • 2.7 函数
  • 2.7.1 内置函数
  • 2.7.2 自定义函数
  • 2.8 模块的导入
  • 2.8.1 import语句导入法
  • 2.8.2 from语句导入法
  • 第3章 数组的存储和处理——NumPy模块
  • 3.1 创建数组
  • 3.1.1 使用array()函数创建数组
  • 3.1.2 创建等差数组
  • 3.1.3 创建随机数组
  • 3.2 查看数组的属性
  • 3.3 选取数组元素
  • 3.3.1 一维数组的元素选取
  • 3.3.2 二维数组的元素选取
  • 3.4 数组的重塑与转置
  • 3.4.1 一维数组的重塑
  • 3.4.2 多维数组的重塑
  • 3.4.3 数组的转置
  • 3.5 数组的处理
  • 3.5.1 添加数组元素
  • 3.5.2 删除数组元素
  • 3.5.3 处理数组的缺失值
  • 3.5.4 处理数组的重复值
  • 3.5.5 拼接数组
  • 3.5.6 拆分数组
  • 3.6 数组的运算
  • 3.6.1 数组之间的四则运算
  • 3.6.2 数组元素的统计运算
  • 第4章 数据的简单处理——pandas模块入门
  • 4.1 数据结构
  • 4.1.1 Series对象
  • 4.1.2 DataFrame对象
  • 4.2 读取数据
  • 4.2.1 读取Excel工作簿数据
  • 4.2.2 读取csv文件数据
  • 4.3 查看数据
  • 4.3.1 查看数据的前几行
  • 4.3.2 查看数据的行数和列数
  • 4.3.3 查看数据的类型
  • 4.4 选择数据
  • 4.4.1 选择行数据
  • 4.4.2 选择列数据
  • 4.4.3 同时选择行列数据
  • 4.5 修改行标签和列标签
  • 第5章 数据的高级处理——pandas模块进阶
  • 5.1 数据的查找和替换
  • 5.1.1 查找数据
  • 5.1.2 替换数据
  • 5.2 数据的处理
  • 5.2.1 插入数据
  • 5.2.2 删除数据
  • 5.2.3 处理缺失值
  • 5.2.4 处理重复值
  • 5.2.5 排序数据
  • 5.2.6 筛选数据
  • 5.3 数据表的处理
  • 5.3.1 转置数据表的行列
  • 5.3.2 将数据表转换为树形结构
  • 5.3.3 数据表的拼接
  • 5.4 数据的运算
  • 5.4.1 数据的统计运算
  • 5.4.2 获取数值分布情况
  • 5.4.3 计算相关系数
  • 5.4.4 分组汇总数据
  • 5.4.5 创建数据透视表
  • 5.5 案例:获取并分析股票历史数据
  • 第6章 使用Python进行数据分析
  • 6.1 相关性分析
  • 6.1.1 获取股价数据
  • 6.1.2 合并股价数据
  • 6.1.3 股价数据相关性分析
  • 6.2 假设检验
  • 6.3 方差分析
  • 6.3.1 方差分析的基本步骤
  • 6.3.2 单因素方差分析的代码实现
  • 6.3.3 双因素方差分析的代码实现
  • 6.3.4 利用第三方模块快速完成方差分析
  • 6.4 描述性统计分析
  • 6.4.1 描述性统计指标的计算
  • 6.4.2 数据的分布状态分析
  • 6.4.3 数据的频数和频率分析
  • 6.5 线性回归分析
  • 6.5.1 线性回归分析的数学原理
  • 6.5.2 线性回归分析的思路
  • 6.5.3 广告费与销量的一元线性回归分析
  • 6.5.4 不同渠道的广告费与销量的多元线性回归分析
  • 第7章 Python爬虫基础
  • 7.1 认识网页结构
  • 7.1.1 查看网页的源代码
  • 7.1.2 网页结构的组成
  • 7.1.3 百度新闻页面结构剖析
  • 7.2 requests模块
  • 7.2.1 requests模块获取数据的方式
  • 7.2.2 get()函数的参数介绍
  • 7.3 案例:爬取豆瓣电影动画排行榜
  • 7.4 正则表达式
  • 7.4.1 正则表达式基础
  • 7.4.2 用正则表达式提取数据
  • 7.5 BeautifulSoup模块
  • 7.5.1 实例化BeautifulSoup对象
  • 7.5.2 用BeautifulSoup对象定位标签
  • 7.5.3 从标签中提取文本内容和属性值
  • 7.6 XPath表达式
  • 7.6.1 实例化etree对象
  • 7.6.2 用XPath表达式定位标签并提取数据
  • 7.6.3 快速获取标签节点的XPath表达式
  • 7.7 数据清洗
  • 7.8 案例:爬取当当网的图书销售排行榜
  • 第8章 Python爬虫进阶
  • 8.1 Selenium模块基础
  • 8.1.1 Selenium模块的安装与基本用法
  • 8.1.2 Selenium模块的标签定位
  • 8.1.3 Selenium模块的标签操作
  • 8.2 Selenium模块进阶
  • 8.2.1 模拟鼠标操作
  • 8.2.2 <iframe>标签处理
  • 8.2.3 显式等待和隐式等待
  • 8.3 案例:模拟登录12306
  • 8.4 IP反爬的应对
  • 8.4.1 IP反爬的应对思路
  • 8.4.2 搭建代理IP池
  • 8.4.3 实战案例
  • 8.5 用cookie池模拟登录
  • 8.5.1 用浏览器获取cookie信息
  • 8.5.2 自动记录cookie信息
  • 8.5.3 cookie池的搭建和使用
  • 8.6 提高爬虫程序的数据爬取效率
  • 8.6.1 多进程实现并行
  • 8.6.2 进程池的创建
  • 8.6.3 多线程实现并发
  • 8.6.4 线程池的创建
  • 8.6.5 多任务异步协程实现并发
  • 8.6.6 多进程、多线程和多任务异步协程在爬虫中的应用
  • 第9章 表格数据获取与数据库详解
  • 9.1 表格类数据的获取
  • 9.1.1 用于构建表格的标签
  • 9.1.2 read_html()函数的基本用法
  • 9.2 用数据库存取数据
  • 9.2.1 数据库概述
  • 9.2.2 MySQL的安装和配置
  • 9.2.3 数据表的基本操作
  • 9.2.4 数据表中数据的基本操作
  • 9.2.5 用PyMySQL模块操作数据库
  • 9.2.6 用pandas模块操作数据库
  • 9.3 案例:爬取58同城租房信息
  • 第10章 自然语言处理
  • 10.1 NLP概述
  • 10.1.1 NLP的应用领域和基本流程
  • 10.1.2 文本分词方法
  • 10.2 jieba分词器
  • 10.2.1 jieba分词器的基础知识
  • 10.2.2 jieba分词器的基本用法
  • 10.2.3 调整词典
  • 10.2.4 关键词提取
  • 10.2.5 停用词过滤
  • 10.2.6 词频统计
  • 10.3 案例:新闻关键词的提取与汇总
  • 第11章 数据可视化——Matplotlib模块
  • 11.1 绘制基本图表
  • 11.1.1 绘制柱形图
  • 11.1.2 绘制条形图
  • 11.1.3 绘制折线图
  • 11.1.4 绘制面积图
  • 11.1.5 绘制散点图
  • 11.1.6 绘制饼图和圆环图
  • 11.2 图表的绘制和美化技巧
  • 11.2.1 在一张画布中绘制多个图表
  • 11.2.2 添加图表元素
  • 11.2.3 添加并设置网格线
  • 11.2.4 调整坐标轴的刻度范围
  • 11.3 绘制高级图表
  • 11.3.1 绘制气泡图
  • 11.3.2 绘制组合图
  • 11.3.3 绘制直方图
  • 11.3.4 绘制雷达图
  • 11.3.5 绘制树状图
  • 11.3.6 绘制箱形图
  • 11.3.7 绘制玫瑰图
  • 第12章 数据可视化神器——pyecharts模块
  • 12.1 图表配置项
  • 12.2 绘制漏斗图
  • 12.3 绘制涟漪特效散点图
  • 12.4 绘制水球图
  • 12.5 绘制仪表盘
  • 12.6 绘制词云图
  • 12.7 绘制K线图
  • 第13章 量化金融——股票信息挖掘与分析
  • 13.1 案例介绍
  • 13.2 获取汽车行业股票的基本信息
  • 13.3 获取单只股票的历史行情数据
  • 13.4 获取沪深A股涨幅前60名的信息
  • 13.5 计算股票的月涨跌幅
  • 13.6 股票相关性分析
  • 13.7 股票价格预测
展开全部

评分及书评

5.0
3个评分
  • 用户头像
    给这本书评了
    5.0

    Python 语言功能强大而灵活,具有很强的扩展性,同时它的语法又相对简洁易懂,没有编程基础的普通办公人员经过适当的学习也能轻松上手。本书以 Python 语言为工具,从编程新手的角度和日常办公的需求出发,深入浅出地讲解如何通过 Python 编程高效地完成数据的获取、处理、分析与可视化。

      转发
      评论
      用户头像
      给这本书评了
      5.0
      安利给零基础的胖友

      个人感觉讲的很细致,逻辑也很舒服,更适合没有任何基础和跨专业的小白。对一些统计方法也有比较细致的讲解,总体对新手非常友好。爬虫部分篇幅较短,主要是可视化。如果专攻爬虫的话可以搭配其他书籍来学习。成就感满满🙈🙈🙈

        转发
        评论

      出版方

      机械工业出版社有限公司

      机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。