互联网
类型
8.3
豆瓣评分
可以朗读
语音朗读
129千字
字数
2020-03-01
发行日期
展开全部
主编推荐语
谷歌开发高手通俗讲解数据压缩算法,高效传输和存储海量数据,打造流畅的用户体验。
内容简介
本书的主题是数据压缩,也就是用最紧凑的方式来表示数据。本书先讲解了5类数据压缩算法,即变长编码、统计压缩、字典编码、上下文模型和多上下文模型,然后介绍了香农的信息论,以及怎样通过各种方法来突破熵,如统计编码、自适应统计编码、字典转换、上下文数据转换、数据建模等。本书还讨论了数据压缩中的一些要点,如多媒体数据压缩和通用压缩,并介绍了有损数据压缩。本书最后说明了数据压缩与你、你的公司以及未来的技术是如何相互关联的。
目录
- 版权信息
- O'Reilly Media, Inc.介绍
- 业界评论
- 序
- 前言
- 怎样阅读本书
- 怎样从后往前阅读本书
- 章节概要
- 电子书
- 第1章 并非无趣的一章
- 1.1 5类数据压缩算法
- 1.2 惹人“愤怒”的克劳德·香农
- 1.3 关于数据压缩,你必须知道的
- 建立在数据压缩上的世界
- 第2章 不容错过的一章
- 2.1 理解二进制
- 2.1.1 十进制计数系统
- 2.1.2 二进制计数系统
- 2.2 信息论
- 2.2.1 二分查找
- 2.2.2 熵:表示一个数所需要的最少二进制位数
- 2.2.3 标准的数字长度
- 第3章 突破熵
- 3.1 理解熵
- 3.2 熵有什么用处呢
- 3.3 理解概率
- 3.4 突破熵
- 3.4.1 示例1:增量编码
- 3.4.2 示例2:符号分组
- 3.4.3 示例3:排列
- 3.5 信息论与数据压缩
- 第4章 VLC
- 4.1 摩尔斯码
- 4.2 概率、熵与码字长度
- 4.3 VLC
- 4.3.1 运用VLC
- 4.3.2 创建VLC
- 4.3.3 几个VLC示例
- 4.3.4 为数据集找到最适合的编码方法
- 第5章 统计编码
- 5.1 利用统计使数据压缩接近熵
- 5.2 哈夫曼编码
- 5.2.1 构造哈夫曼树
- 5.2.2 生成码字
- 5.2.3 编码和解码
- 5.2.4 实际的实现方法
- 5.3 算术编码
- 5.3.1 找出正确的数
- 5.3.2 编码
- 5.3.3 选择正确的输出值
- 5.3.4 解码
- 5.3.5 具体实现
- 5.4 ANS
- 5.4.1 通过转换表来编码和解码
- 5.4.2 创建备查表
- 5.4.3 使用ANS压缩数据
- 5.4.4 解码示例
- 5.4.5 压缩是从哪里来的
- 5.5 在实际压缩中,选择哪一种统计压缩算法
- 第6章 自适应统计编码
- 6.1 位置对熵的重要性
- 6.2 自适应VLC编码
- 6.2.1 动态创建VLC表
- 6.2.2 字面值
- 6.2.3 重置
- 6.2.4 知道何时重置
- 6.2.5 实际中的应用
- 6.3 自适应算术编码
- 6.4 自适应哈夫曼编码
- 6.5 现代的选择
- 第7章 字典转换
- 7.1 基本字典转换
- 找出正确的“单词”
- 7.2 LZ算法
- 7.2.1 LZ算法的工作原理
- 7.2.2 编码
- 7.2.3 解码
- 7.2.4 压缩LZ算法的输出
- 7.2.5 LZ算法的变体
- 7.3 尽可能多地收集数据
- 第8章 上下文数据转换
- 8.1 RLE
- 8.1.1 处理短行程问题
- 8.1.2 压缩
- 8.2 增量编码
- 8.2.1 XOR增量编码
- 8.2.2 参照系增量编码
- 8.2.3 修正的参照系增量编码
- 8.2.4 压缩增量编码后的数据
- 8.2.5 那么它对文本有效吗
- 8.3 MTF
- 8.3.1 消除捣乱符号的影响
- 8.3.2 压缩MTF
- 8.4 BWT
- 8.4.1 顺序很重要
- 8.4.2 BWT的工作原理
- 8.4.3 BWT的逆操作
- 8.4.4 具体的实现
- 8.4.5 压缩BWT后的数据
- 第9章 数据建模
- 9.1 马尔可夫链
- 9.1.1 马尔可夫链与压缩
- 9.1.2 实际的实现
- 9.2 部分匹配预测算法
- 9.2.1 单词查找树
- 9.2.2 字符的压缩
- 9.2.3 选择一个合理的N值
- 9.2.4 处理未知的符号
- 9.3 上下文混合算法
- 9.3.1 模型的类型
- 9.3.2 混合的类型
- 9.4 下一代技术
- 第10章 换个话题
- 10.1 多媒体数据压缩
- 10.2 通用压缩
- 10.3 实践中的数据压缩
- 第11章 评价数据压缩
- 11.1 数据压缩的使用场景
- 11.1.1 线下压缩,客户端解压
- 11.1.2 客户端压缩,云端解压
- 11.1.3 云端压缩,客户端解压
- 11.1.4 客户端压缩,客户端解压
- 11.2 数据压缩的需求
- 11.3 压缩率
- 11.4 压缩性能
- 11.5 解压性能
- 11.6 解码流的能力
- 11.7 比较压缩算法
- 第12章 压缩图像数据
- 12.1 理解图像质量与文件大小
- 12.1.1 是什么降低了图像的质量
- 12.1.2 度量图像质量
- 12.1.3 让想法真正工作
- 12.2 图像的尺寸很重要
- 12.3 选择正确的图像格式
- 12.3.1 PNG
- 12.3.2 JPG
- 12.3.3 GIF
- 12.3.4 WebP
- 12.3.5 现在,到了选择的时刻
- 12.4 GPU纹理格式
- 12.5 矢量格式
- 12.6 收获的捷径
- 第13章 序列化数据
- 13.1 了解常见的使用场景
- 13.1.1 服务器动态生成的数据
- 13.1.2 服务器拥有的静态数据
- 13.1.3 客户端动态生成的数据
- 13.1.4 客户端拥有的静态数据
- 13.2 序列化格式的问题
- 13.2.1 可读文本
- 13.2.2 解码时间长
- 13.3 更小的序列化数据
- 13.3.1 使用二进制序列化格式
- 13.3.2 重构列表以获得更好的压缩
- 13.3.3 组织数据以便高效获取
- 13.3.4 将数据切分为适当的压缩格式
- 第14章 有损数据压缩
- 第15章 让世界变得更小
- 15.1 数据压缩与你
- 15.2 数据压缩与盈利
- 15.2.1 用户获取与保持
- 15.2.2 运行成本
- 15.2.3 提前规划
- 15.3 让用户的生活更美好更便宜
- 15.4 对下一步技术的思考
- 15.4.1 未来的50亿用户
- 15.4.2 移动网络
- 15.5 开始行动
- 数据压缩术语表
- 关于作者
- 关于封面
- 看完了
展开全部
出版方
人民邮电出版社·图灵出品
图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。