展开全部

主编推荐语

谷歌开发高手通俗讲解数据压缩算法,高效传输和存储海量数据,打造流畅的用户体验。

内容简介

本书的主题是数据压缩,也就是用最紧凑的方式来表示数据。本书先讲解了5类数据压缩算法,即变长编码、统计压缩、字典编码、上下文模型和多上下文模型,然后介绍了香农的信息论,以及怎样通过各种方法来突破熵,如统计编码、自适应统计编码、字典转换、上下文数据转换、数据建模等。本书还讨论了数据压缩中的一些要点,如多媒体数据压缩和通用压缩,并介绍了有损数据压缩。本书最后说明了数据压缩与你、你的公司以及未来的技术是如何相互关联的。

目录

  • 版权信息
  • O'Reilly Media, Inc.介绍
  • 业界评论
  • 前言
  • 怎样阅读本书
  • 怎样从后往前阅读本书
  • 章节概要
  • 电子书
  • 第1章 并非无趣的一章
  • 1.1 5类数据压缩算法
  • 1.2 惹人“愤怒”的克劳德·香农
  • 1.3 关于数据压缩,你必须知道的
  • 建立在数据压缩上的世界
  • 第2章 不容错过的一章
  • 2.1 理解二进制
  • 2.1.1 十进制计数系统
  • 2.1.2 二进制计数系统
  • 2.2 信息论
  • 2.2.1 二分查找
  • 2.2.2 熵:表示一个数所需要的最少二进制位数
  • 2.2.3 标准的数字长度
  • 第3章 突破熵
  • 3.1 理解熵
  • 3.2 熵有什么用处呢
  • 3.3 理解概率
  • 3.4 突破熵
  • 3.4.1 示例1:增量编码
  • 3.4.2 示例2:符号分组
  • 3.4.3 示例3:排列
  • 3.5 信息论与数据压缩
  • 第4章 VLC
  • 4.1 摩尔斯码
  • 4.2 概率、熵与码字长度
  • 4.3 VLC
  • 4.3.1 运用VLC
  • 4.3.2 创建VLC
  • 4.3.3 几个VLC示例
  • 4.3.4 为数据集找到最适合的编码方法
  • 第5章 统计编码
  • 5.1 利用统计使数据压缩接近熵
  • 5.2 哈夫曼编码
  • 5.2.1 构造哈夫曼树
  • 5.2.2 生成码字
  • 5.2.3 编码和解码
  • 5.2.4 实际的实现方法
  • 5.3 算术编码
  • 5.3.1 找出正确的数
  • 5.3.2 编码
  • 5.3.3 选择正确的输出值
  • 5.3.4 解码
  • 5.3.5 具体实现
  • 5.4 ANS
  • 5.4.1 通过转换表来编码和解码
  • 5.4.2 创建备查表
  • 5.4.3 使用ANS压缩数据
  • 5.4.4 解码示例
  • 5.4.5 压缩是从哪里来的
  • 5.5 在实际压缩中,选择哪一种统计压缩算法
  • 第6章 自适应统计编码
  • 6.1 位置对熵的重要性
  • 6.2 自适应VLC编码
  • 6.2.1 动态创建VLC表
  • 6.2.2 字面值
  • 6.2.3 重置
  • 6.2.4 知道何时重置
  • 6.2.5 实际中的应用
  • 6.3 自适应算术编码
  • 6.4 自适应哈夫曼编码
  • 6.5 现代的选择
  • 第7章 字典转换
  • 7.1 基本字典转换
  • 找出正确的“单词”
  • 7.2 LZ算法
  • 7.2.1 LZ算法的工作原理
  • 7.2.2 编码
  • 7.2.3 解码
  • 7.2.4 压缩LZ算法的输出
  • 7.2.5 LZ算法的变体
  • 7.3 尽可能多地收集数据
  • 第8章 上下文数据转换
  • 8.1 RLE
  • 8.1.1 处理短行程问题
  • 8.1.2 压缩
  • 8.2 增量编码
  • 8.2.1 XOR增量编码
  • 8.2.2 参照系增量编码
  • 8.2.3 修正的参照系增量编码
  • 8.2.4 压缩增量编码后的数据
  • 8.2.5 那么它对文本有效吗
  • 8.3 MTF
  • 8.3.1 消除捣乱符号的影响
  • 8.3.2 压缩MTF
  • 8.4 BWT
  • 8.4.1 顺序很重要
  • 8.4.2 BWT的工作原理
  • 8.4.3 BWT的逆操作
  • 8.4.4 具体的实现
  • 8.4.5 压缩BWT后的数据
  • 第9章 数据建模
  • 9.1 马尔可夫链
  • 9.1.1 马尔可夫链与压缩
  • 9.1.2 实际的实现
  • 9.2 部分匹配预测算法
  • 9.2.1 单词查找树
  • 9.2.2 字符的压缩
  • 9.2.3 选择一个合理的N值
  • 9.2.4 处理未知的符号
  • 9.3 上下文混合算法
  • 9.3.1 模型的类型
  • 9.3.2 混合的类型
  • 9.4 下一代技术
  • 第10章 换个话题
  • 10.1 多媒体数据压缩
  • 10.2 通用压缩
  • 10.3 实践中的数据压缩
  • 第11章 评价数据压缩
  • 11.1 数据压缩的使用场景
  • 11.1.1 线下压缩,客户端解压
  • 11.1.2 客户端压缩,云端解压
  • 11.1.3 云端压缩,客户端解压
  • 11.1.4 客户端压缩,客户端解压
  • 11.2 数据压缩的需求
  • 11.3 压缩率
  • 11.4 压缩性能
  • 11.5 解压性能
  • 11.6 解码流的能力
  • 11.7 比较压缩算法
  • 第12章 压缩图像数据
  • 12.1 理解图像质量与文件大小
  • 12.1.1 是什么降低了图像的质量
  • 12.1.2 度量图像质量
  • 12.1.3 让想法真正工作
  • 12.2 图像的尺寸很重要
  • 12.3 选择正确的图像格式
  • 12.3.1 PNG
  • 12.3.2 JPG
  • 12.3.3 GIF
  • 12.3.4 WebP
  • 12.3.5 现在,到了选择的时刻
  • 12.4 GPU纹理格式
  • 12.5 矢量格式
  • 12.6 收获的捷径
  • 第13章 序列化数据
  • 13.1 了解常见的使用场景
  • 13.1.1 服务器动态生成的数据
  • 13.1.2 服务器拥有的静态数据
  • 13.1.3 客户端动态生成的数据
  • 13.1.4 客户端拥有的静态数据
  • 13.2 序列化格式的问题
  • 13.2.1 可读文本
  • 13.2.2 解码时间长
  • 13.3 更小的序列化数据
  • 13.3.1 使用二进制序列化格式
  • 13.3.2 重构列表以获得更好的压缩
  • 13.3.3 组织数据以便高效获取
  • 13.3.4 将数据切分为适当的压缩格式
  • 第14章 有损数据压缩
  • 第15章 让世界变得更小
  • 15.1 数据压缩与你
  • 15.2 数据压缩与盈利
  • 15.2.1 用户获取与保持
  • 15.2.2 运行成本
  • 15.2.3 提前规划
  • 15.3 让用户的生活更美好更便宜
  • 15.4 对下一步技术的思考
  • 15.4.1 未来的50亿用户
  • 15.4.2 移动网络
  • 15.5 开始行动
  • 数据压缩术语表
  • 关于作者
  • 关于封面
  • 看完了
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

人民邮电出版社·图灵出品

图灵社区成立于2005年6月,由人民邮电出版社投资控股,以策划出版高质量的科技书籍为核心业务,主要出版领域包括计算机、电子电气、数学统计、科普等,通过引进国际高水平的教材、专著,以及发掘国内优秀原创作品等途径,为目标读者提供一流的内容。