展开全部

主编推荐语

基于Python 3.X讲解,从入门到实战,全面讲解Python爬虫技术。全书重点难点附带微课讲解,书网融合互动学习。

内容简介

本书较为全面地介绍了定向爬虫的开发过程、各种反爬虫机制的破解方法和爬虫开发的相关技巧。全书共13章,包括绪论、Python基础、正则表达式与文件操作、简单的网页爬虫开发、高性能HTML内容解析、Python与数据库、异步加载与请求头、模拟登录与验证码、抓包与中间人爬虫、Android原生App爬虫、Scrapy、Scrapy应用、爬虫开发中的法律和道德问题等。除第 1、12、13章外的其他章末尾都有动手实践,以帮助读者巩固本章和前面章节所学的内容。针对书中的疑难内容,还配有视频讲解,以便更好地演示相关操作。

目录

  • 版权信息
  • 内容提要
  • 前言
  • 第1章 绪论
  • 1.1 爬虫
  • 1.2 爬虫可以做什么
  • 1.3 爬虫开发技术
  • 第2章 Python基础
  • 2.1 Python的安装和运行
  • 2.2 Python开发环境
  • 2.3 Python的数据结构和控制结构
  • 2.4 函数与类
  • 2.5 阶段案例——猜数游戏
  • 2.6 本章小结
  • 2.7 动手实践
  • 第3章 正则表达式与文件操作
  • 3.1 正则表达式
  • 3.2 Python文件操作
  • 3.3 阶段案例——半自动爬虫开发
  • 3.4 本章小结
  • 3.5 动手实践
  • 第4章 简单的网页爬虫开发
  • 4.1 使用Python获取网页源代码
  • 4.2 多线程爬虫
  • 4.3 爬虫的常见搜索算法
  • 4.4 阶段案例——小说网站爬虫开发
  • 4.5 本章小结
  • 4.6 动手实践
  • 第5章 高性能HTML内容解析
  • 5.1 HTML基础
  • 5.2 XPath
  • 5.3 Beautiful Soup4
  • 5.4 阶段案例——大麦网演出爬虫
  • 5.5 本章小结
  • 5.6 动手实践
  • 第6章 Python与数据库
  • 6.1 MongoDB
  • 6.2 Redis
  • 6.3 MongoDB的优化建议
  • 6.4 阶段案例
  • 6.5 本章小结
  • 6.6 动手实践
  • 第7章 异步加载与请求头
  • 7.1 异步加载
  • 7.2 请求头(Headers)
  • 7.3 模拟浏览器
  • 7.4 阶段案例
  • 7.5 本章小结
  • 7.6 动手实践
  • 第8章 模拟登录与验证码
  • 8.1 模拟登录
  • 8.2 验证码
  • 8.3 阶段案例——自动登录果壳网
  • 8.4 本章小结
  • 8.5 动手实践
  • 第9章 抓包与中间人爬虫
  • 9.1 数据抓包
  • 9.2 中间人爬虫
  • 9.3 阶段案例——Keep热门
  • 9.4 本章小结
  • 9.5 动手实践
  • 第10章 Android原生App爬虫
  • 10.1 实现原理
  • 10.2 综合应用
  • 10.3 阶段案例——BOSS直聘爬虫
  • 10.4 本章小结
  • 10.5 动手实践
  • 第11章 Scrapy
  • 11.1 Scrapy的安装
  • 11.2 Scrapy的使用
  • 11.3 Scrapy与MongoDB
  • 11.4 Scrapy与Redis
  • 11.5 阶段案例——博客爬虫
  • 11.6 本章小结
  • 11.7 动手实践
  • 第12章 Scrapy高级应用
  • 12.1 中间件(Middleware)
  • 12.2 爬虫的部署
  • 12.3 分布式架构
  • 12.4 阶段案例
  • 12.5 本章小结
  • 第13章 爬虫开发中的法律和道德问题
  • 13.1 法律问题
  • 13.2 道德协议
  • 13.3 本章小结
展开全部

评分及书评

4.8
10个评分
  • 用户头像
    给这本书评了
    5.0
    五星好评,通俗易懂

    全篇讲的非常细致,连我一个外行人都看懂了,并在 Jupyter notebook 中尝试了所有案例,很带劲,入门好书。

      转发
      1
      用户头像
      给这本书评了
      5.0
      墙裂推荐

      1. 最通俗易懂,又有深度的教程;

        转发
        评论
        用户头像
        给这本书评了
        5.0

        写得通俗易懂,然后呢,也是比较靠近现在的一本书了!反正我感觉挺不错的

          转发
          评论
        • 查看全部4条书评

        出版方

        人民邮电出版社

        人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。