计算机
类型
可以朗读
语音朗读
86千字
字数
2018-01-01
发行日期
展开全部
主编推荐语
《Elasticsearch大数据搜索引擎》深入解析应用与开发。
内容简介
《Elasticsearch大数据搜索引擎》一书介绍了Elasticsearch大数据搜索引擎的常见应用场景、原理与深入开发,主要包括支持中英文文本分析的自然语言处理搜索、问答式搜索和Elastic栈日志分析。
目录
- 封面
- 版权页
- 前言
- 目录
- 第1章 使用Elasticsearch
- 1.1 基本概念
- 1.2 安装
- 1.3 搜索集群
- 1.4 创建索引
- 1.5 使用Java客户端接口
- 1.5.1 创建索引
- 1.5.2 增加、删除与修改数据
- 1.5.3 分析器
- 1.5.4 数据导入
- 1.5.5 通过摄取快速导入数据
- 1.5.6 索引库结构
- 1.5.7 查询
- 1.5.8 区间查询
- 1.5.9 排序
- 1.5.10 分布式搜索
- 1.5.11 过滤器
- 1.5.12 高亮显示
- 1.5.13 分页
- 1.5.14 通过聚合实现分组查询
- 1.5.15 文本列的聚合
- 1.5.16 遍历数据
- 1.5.17 索引文档
- 1.5.18 Percolate
- 1.6 RESTClient
- 1.6.1 使用摄取
- 1.6.2 代码实现摄取
- 1.7 使用Jest
- 1.8 Python客户端
- 1.9 Scala客户端
- 1.10 PHP客户端
- 1.11 SQL支持
- 1.12 本章小结
- 第2章 开发插件
- 2.1 搜索中文
- 2.1.1 中文分词原理
- 2.1.2 中文分词插件原理
- 2.1.3 开发中文分词插件
- 2.1.4 中文AnalyzerProvider
- 2.1.5 字词混合索引
- 2.2 搜索英文
- 2.2.1 句子切分
- 2.2.2 标注词性
- 2.3 使用测试套件
- 2.4 本章小结
- 第3章 管理搜索集群
- 3.1 节点类型
- 3.2 管理集群
- 3.3 写入权限控制
- 3.4 使用X-Pack
- 3.5 快照
- 3.6 Zen发现机制
- 3.7 联合搜索
- 3.8 缓存
- 3.9 本章小结
- 第4章 源码分析
- 4.1 Lucene源码分析
- 4.1.1 Ivy管理依赖项
- 4.1.2 源码结构介绍
- 4.2 Gradle
- 4.3 Guice
- 4.4 Joda-Time
- 4.5 Transport
- 4.6 线程池
- 4.7 模块
- 4.8 Netty
- 4.9 分布式
- 4.10 本章小结
- 第5章 搜索相关性
- 5.1 BM25检索模型
- 5.1.1 使用BM25检索模型
- 5.1.2 参数调优
- 5.2 学习评分
- 5.2.1 基本原理
- 5.2.2 准备数据
- 5.2.3 Elasticsearch学习排名
- 5.3 本章小结
- 第6章 搜索引擎用户界面
- 6.1 JSP实现搜索界面
- 6.1.1 用于显示搜索结果的自定义标签
- 6.1.2 使用Listlib
- 6.1.3 实现翻页
- 6.2 使用Spring实现的搜索界面
- 6.2.1 实现REST搜索界面
- 6.2.2 REST API中的HTTP PUT
- 6.2.3 Spring-data-elasticsearch
- 6.2.4 Spring HATEOAS
- 6.3 实现搜索接口
- 6.3.1 编码识别
- 6.3.2 布尔搜索
- 6.3.3 搜索结果排序
- 6.4 实现相似文档搜索
- 6.5 实现AJAX搜索联想词
- 6.5.1 估计查询词的文档频率
- 6.5.2 搜索联想词总体结构
- 6.5.3 服务器端处理
- 6.5.4 浏览器端处理
- 6.5.5 拼音提示
- 6.5.6 部署总结
- 6.5.7 Suggester
- 6.6 推荐搜索词
- 6.6.1 挖掘相关搜索词
- 6.6.2 使用多线程计算相关搜索词
- 6.7 查询意图理解
- 6.7.1 拼音搜索
- 6.7.2 无结果处理
- 6.8 集成其他功能
- 6.8.1 拼写检查
- 6.8.2 分类统计
- 6.8.3 相关搜索
- 6.8.4 再次查找
- 6.8.5 搜索日志
- 6.9 查询分析
- 6.9.1 历史搜索词记录
- 6.9.2 日志信息过滤
- 6.9.3 信息统计
- 6.9.4 挖掘日志信息
- 6.9.5 查询词意图分析
- 6.10 部署网站
- 6.10.1 部署到Web服务器
- 6.10.2 防止攻击
- 6.11 本章小结
- 第7章 OCR文字识别
- 7.1 Tesseract
- 7.2 使用TensorFlow识别文字
- 7.3 OpenCV
- 7.3.1 预处理
- 7.3.2 文字区域提取
- 7.3.3 纠正偏斜
- 7.3.4 Linux环境支持
- 7.4 JavaCV
- 7.5 本章小结
- 第8章 问答式搜索
- 8.1 生成表示语义的代码
- 8.2 信息整合
- 8.2.1 实体对齐
- 8.2.2 编辑距离
- 8.2.3 Jaro-Winkler距离
- 8.2.4 比较器
- 8.2.5 Cleaner
- 8.2.6 运行过程
- 8.2.7 遗传算法调整参数
- 8.3 自动问答
- 8.3.1 问句处理器
- 8.3.2 自动发现答案
- 8.4 本章小结
- 第9章 Elastic系统监控
- 9.1 Logstash
- 9.1.1 使用Logstash
- 9.1.2 插件
- 9.1.3 数据库输入插件
- 9.2 Filebeat
- 9.3 消息过期
- 9.4 Kibana
- 9.5 Flume
- 9.6 Kafka
- 9.7 Graylog
- 9.8 物联网数据
- 9.9 本章小结
- 反侵权盗版声明
展开全部
出版方
电子工业出版社
电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。