展开全部

主编推荐语

介绍爬虫、数据抓取和数据分析完整过程。

内容简介

本书从多个数据项目实例出发,介绍爬虫、反爬虫的各种案例,使读者了解到数据抓取和分析的完整过程。书中案例的难度由浅入深,以作者原创的代码为主,不借助现成的框架,强调在数据采集过程中的发散思维,总结攻克反爬虫的思维模式,实现以低成本的方式得到想要的数据的愿望。最后,用一个“爱飞狗”的例子,为读者展示如何从0到1地开发一个大数据产品。

目录

  • 封面
  • 作者简介
  • 扉页
  • 版权信息
  • 前言
  • 目录
  • 第1章 基础知识
  • 1.1 什么是爬虫
  • 1.2 数据获取渠道
  • 1.3 抓包分析工具
  • 1.4 爬虫和反爬虫的斗争
  • 1.5 数据处理、分析和可视化
  • 1.6 延深阅读
  • 第2章 基于位置信息的爬虫Ⅰ
  • 2.1 背景及目标
  • 2.2 爬虫原理
  • 2.3 数据来源分析
  • 2.4 简单的矩形区域抓取方式
  • 2.5 高级区域抓取方式
  • 2.6 坐标转换
  • 2.7 存储数据的方式
  • 2.8 数据导入
  • 2.9 基本数据分析
  • 2.10 地图可视化
  • 2.11 轨迹可视化
  • 2.12 总结
  • 第3章 基于位置信息的爬虫Ⅱ
  • 3.1 背景及目标
  • 3.2 爬虫原理
  • 3.3 优化方案一
  • 3.4 优化方案二
  • 3.5 优化方案三
  • 3.6 导入数据到数据库
  • 3.7 基本数据分析及可视化
  • 3.8 总结
  • 第4章 网站信息抓取及可视化
  • 4.1 背景及目标
  • 4.2 网站API分析
  • 4.3 数据抓取
  • 4.4 数据导入
  • 4.5 数据分析及可视化
  • 4.6 总结
  • 第5章 基于逆向分析小程序的爬虫
  • 5.1 背景及目标
  • 5.2 数据来源分析
  • 5.3 数据抓取方案
  • 5.4 转换数据格式
  • 5.5 总结
  • 第6章 从数据到产品
  • 6.1 从一张机票说起
  • 6.2 从价值探索到交付落地
  • 6.3 数据抓取
  • 6.4 爬虫架构设计
  • 6.5 发现数据的价值
  • 6.6 创新的不确定性
  • 6.7 产品设计
  • 6.8 产品交付
  • 6.9 总结
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。