互联网
类型
可以朗读
语音朗读
92千字
字数
2022-08-01
发行日期
展开全部
主编推荐语
本书重点介绍大数据概率数据结构与算法的核心思想和重要应用领域。
内容简介
本书共6章。每章都专门针对大数据应用中的一个特定问题,首先对该问题进行深入的解释,然后介绍可用于有效解决该问题的数据结构和算法。
第1章简要概述了概率数据结构中广泛使用的散列函数和散列表;第2章专门介绍近似成员查询,这是概率数据结构最著名的用例之一;第3章讨论了用来辅助估算元素基数的概率数据结构;第4章和第5章讨论流式场景下与频数和排序相关的重要指标的计算;第6章包含用于解决相似性问题的数据结构和算法,尤其是近邻搜索问题。
目录
- 版权信息
- 作者简介
- 译者简介
- 译者序
- 前言
- 第1章 散列
- 1.1 加密散列函数
- 1.2 非加密散列函数
- 1.3 散列表
- 1.4 总结
- 本章参考文献
- 第2章 成员查询
- 2.1 布隆过滤器
- 2.2 计数布隆过滤器
- 2.3 商数过滤器
- 2.4 布谷过滤器
- 2.5 总结
- 本章参考文献
- 第3章 基数
- 3.1 线性计数
- 3.2 概率计数
- 3.3 LogLog和HyperLogLog
- 3.4 总结
- 本章参考文献
- 第4章 频数
- 4.1 多数投票算法
- 4.2 频繁算法
- 4.3 Count Sketch
- 4.4 Count-Min Sketch
- 4.5 总结
- 本章参考文献
- 第5章 排序
- 5.1 随机采样
- 5.2 q-摘要
- 5.3 t-摘要
- 5.4 总结
- 本章参考文献
- 第6章 相似性
- 6.1 局部敏感散列
- 6.2 MinHash
- 6.3 SimHash
- 6.4 总结
- 本章参考文献
展开全部
出版方
机械工业出版社有限公司
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。