展开全部

主编推荐语

零基础学python、网络爬虫,让繁琐的工作自动化,减少重复工作。

内容简介

本书是一本案例驱动型的Python编程指南,将语法知识和编程思路融入大量的典型案例,带领读者一步步学会将Python打造成自动化办公的利器。

全书共10章,可划分为4个部分。第1部分包括第1章和第2章,主要讲解Python编程环境的搭建方法和Python的基础语法知识。第2部分包括第3~7章,通过大量案例讲解如何用Python自动化处理计算机文件、PDF文件和Office文件。第3部分包括第8章和第9章,主要讲解如何利用Python编写爬虫程序,自动从网页上爬取数据。第4部分为第10章,主要讲解如何利用Python自动发送电子邮件。

本书案例典型实用,讲解浅显易懂,适合具备一定的Office软件操作基础又想进一步提高工作效率的办公人员,如从事文秘、行政、人事、营销、财务等职业的人士阅读,也可供Python编程初学者参考。

目录

  • 版权信息
  • 前言
  • 如何获取学习资源
  • 第1章 Python快速上手
  • 1.1 Python编程环境的搭建
  • 1.1.1 安装与配置Anaconda
  • 1.1.2 安装与配置PyCharm
  • 1.2 Python的模块
  • 1.2.1 初识模块
  • 1.2.2 模块的安装
  • 1.3 常见问题和解决办法
  • 第2章 Python的基础语法知识
  • 2.1 变量
  • 2.2 数据类型:数字与字符串
  • 2.2.1 数字
  • 2.2.2 字符串
  • 2.2.3 数据类型的查询
  • 2.2.4 数据类型的转换
  • 2.3 数据类型:列表、字典、元组与集合
  • 2.3.1 列表
  • 2.3.2 字典
  • 2.3.3 元组和集合
  • 2.4 运算符
  • 2.4.1 算术运算符和字符串运算符
  • 2.4.2 比较运算符
  • 2.4.3 赋值运算符
  • 2.4.4 逻辑运算符
  • 2.5 编码基本规范
  • 2.5.1 缩进
  • 2.5.2 注释
  • 2.6 控制语句
  • 2.6.1 if语句
  • 2.6.2 for语句
  • 2.6.3 while语句
  • 2.6.4 控制语句的嵌套
  • 2.7 函数
  • 2.7.1 内置函数
  • 2.7.2 自定义函数
  • 2.8 模块的导入
  • 2.8.1 import语句导入法
  • 2.8.2 from语句导入法
  • 第3章 自动化整理计算机文件
  • 3.1 文件的自动分类
  • 3.2 文件和文件夹的快速查找
  • 3.3 自动清理重复文件
  • 3.4 批量转换图片的格式
  • 3.5 按照日期自动分类图片
  • 第4章 自动化处理PDF文件
  • 4.1 批量下载PDF文件
  • 4.1.1 使用Selenium模块爬取多页内容
  • 4.1.2 使用Selenium模块批量下载PDF文件
  • 4.2 批量合并PDF文件
  • 4.3 批量拆分PDF文件
  • 4.4 批量加密PDF文件
  • 4.5 批量为PDF文件添加水印
  • 4.5.1 自定义函数创建水印文件
  • 4.5.2 自定义函数添加水印
  • 4.5.3 使用循环为每个PDF文件添加水印
  • 第5章 自动化处理Word文档
  • 5.1 批量生成Word合同
  • 5.1.1 读取文件并进行查找和替换
  • 5.1.2 使用循环套用模板生成合同
  • 5.2 将Word文档批量转换为PDF文件
  • 5.3 在Word文档中批量标记关键词
  • 5.4 在Word文档中批量替换关键词
  • 第6章 自动化处理Excel工作簿
  • 6.1 批量生成产品出货清单
  • 6.1.1 提取出货统计表中的数据
  • 6.1.2 使用for语句创建产品出货清单
  • 6.2 批量替换工作簿的单元格数据
  • 6.3 将多个工作表合并为一个工作表
  • 6.3.1 使用xlwings模块读取多个工作表中的数据
  • 6.3.2 新建工作簿存放合并后的数据
  • 6.4 将一个工作表拆分为多个工作簿
  • 6.5 批量拆分列数据
  • 6.6 批量分类汇总数据
  • 第7章 自动化处理PowerPoint演示文稿
  • 7.1 批量提取演示文稿中的文本内容
  • 7.2 将演示文稿批量导出为图片和PDF文件
  • 7.3 自动读取图文素材制作演示文稿
  • 7.4 批量提取演示文稿中的图片素材
  • 第8章 爬虫技术基础
  • 8.1 认识网页结构
  • 8.1.1 查看网页的源代码
  • 8.1.2 初步了解网页结构
  • 8.1.3 网页结构的组成
  • 8.1.4 百度新闻页面结构剖析
  • 8.2 Requests模块
  • 8.3 正则表达式
  • 8.3.1 正则表达式基础知识
  • 8.3.2 使用正则表达式提取数据
  • 8.4 Selenium模块
  • 8.4.1 网页数据爬取的难点
  • 8.4.2 浏览器驱动程序的下载与安装
  • 8.4.3 使用Selenium模块获取网页真正的源代码
  • 8.4.4 使用Selenium模块模拟鼠标和键盘操作
  • 第9章 爬虫实战演练
  • 9.1 爬取图书数据——当当网
  • 9.1.1 使用Requests模块获取网页源代码
  • 9.1.2 编写正则表达式提取图书数据
  • 9.1.3 批量爬取多页数据
  • 9.2 爬取新闻数据——新浪新闻
  • 9.2.1 使用Selenium模块获取网页源代码
  • 9.2.2 编写正则表达式提取新闻数据
  • 9.2.3 自定义函数完成多个关键词的批量爬取
  • 9.3 爬取价格数据——农业农村部网站
  • 9.3.1 使用Selenium模块获取网页源代码
  • 9.3.2 使用pandas模块获取网页中的表格数据
  • 9.3.3 批量爬取多页数据
  • 9.4 爬取职位数据——前程无忧网
  • 9.4.1 使用Selenium模块搜索职位
  • 9.4.2 编写正则表达式提取数据并保存
  • 9.4.3 批量爬取多页数据
  • 9.5 爬取财务报表——东方财富网
  • 9.5.1 使用Selenium模块爬取单页财务报表
  • 9.5.2 使用Selenium模块爬取多页财务报表
  • 9.5.3 爬取指定时期和指定种类的财务数据
  • 第10章 自动化处理电子邮件
  • 10.1 自动发送电子邮件
  • 10.1.1 获取SMTP授权码
  • 10.1.2 自动发送文本格式的电子邮件
  • 10.1.3 自动发送HTML格式的电子邮件
  • 10.1.4 自动发送带附件的电子邮件
  • 10.2 批量发送电子邮件
  • 10.3 定时发送电子邮件
  • 10.3.1 自动爬取数据并通过电子邮件发送
  • 10.3.2 利用while True循环实现定时发送电子邮件
  • 10.3.3 利用Schedule模块实现定时发送电子邮件
  • 10.4 云服务器简介
展开全部

评分及书评

尚无评分
目前还没人评分
  • 加载中...

出版方

机械工业出版社有限公司

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。