互联网
类型
7.7
豆瓣评分
可以朗读
语音朗读
62千字
字数
2019-04-01
发行日期
展开全部
主编推荐语
介绍爬虫、数据抓取和数据分析完整过程。
内容简介
本书从多个数据项目实例出发,介绍爬虫、反爬虫的各种案例,使读者了解到数据抓取和分析的完整过程。书中案例的难度由浅入深,以作者原创的代码为主,不借助现成的框架,强调在数据采集过程中的发散思维,总结攻克反爬虫的思维模式,实现以低成本的方式得到想要的数据的愿望。最后,用一个“爱飞狗”的例子,为读者展示如何从0到1地开发一个大数据产品。
目录
- 封面
- 作者简介
- 扉页
- 版权信息
- 前言
- 目录
- 第1章 基础知识
- 1.1 什么是爬虫
- 1.2 数据获取渠道
- 1.3 抓包分析工具
- 1.4 爬虫和反爬虫的斗争
- 1.5 数据处理、分析和可视化
- 1.6 延深阅读
- 第2章 基于位置信息的爬虫Ⅰ
- 2.1 背景及目标
- 2.2 爬虫原理
- 2.3 数据来源分析
- 2.4 简单的矩形区域抓取方式
- 2.5 高级区域抓取方式
- 2.6 坐标转换
- 2.7 存储数据的方式
- 2.8 数据导入
- 2.9 基本数据分析
- 2.10 地图可视化
- 2.11 轨迹可视化
- 2.12 总结
- 第3章 基于位置信息的爬虫Ⅱ
- 3.1 背景及目标
- 3.2 爬虫原理
- 3.3 优化方案一
- 3.4 优化方案二
- 3.5 优化方案三
- 3.6 导入数据到数据库
- 3.7 基本数据分析及可视化
- 3.8 总结
- 第4章 网站信息抓取及可视化
- 4.1 背景及目标
- 4.2 网站API分析
- 4.3 数据抓取
- 4.4 数据导入
- 4.5 数据分析及可视化
- 4.6 总结
- 第5章 基于逆向分析小程序的爬虫
- 5.1 背景及目标
- 5.2 数据来源分析
- 5.3 数据抓取方案
- 5.4 转换数据格式
- 5.5 总结
- 第6章 从数据到产品
- 6.1 从一张机票说起
- 6.2 从价值探索到交付落地
- 6.3 数据抓取
- 6.4 爬虫架构设计
- 6.5 发现数据的价值
- 6.6 创新的不确定性
- 6.7 产品设计
- 6.8 产品交付
- 6.9 总结
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。