展开全部

主编推荐语

《Elasticsearch大数据搜索引擎》深入解析应用与开发。

内容简介

《Elasticsearch大数据搜索引擎》一书介绍了Elasticsearch大数据搜索引擎的常见应用场景、原理与深入开发,主要包括支持中英文文本分析的自然语言处理搜索、问答式搜索和Elastic栈日志分析。

目录

  • 封面
  • 版权页
  • 前言
  • 目录
  • 第1章 使用Elasticsearch
  • 1.1 基本概念
  • 1.2 安装
  • 1.3 搜索集群
  • 1.4 创建索引
  • 1.5 使用Java客户端接口
  • 1.5.1 创建索引
  • 1.5.2 增加、删除与修改数据
  • 1.5.3 分析器
  • 1.5.4 数据导入
  • 1.5.5 通过摄取快速导入数据
  • 1.5.6 索引库结构
  • 1.5.7 查询
  • 1.5.8 区间查询
  • 1.5.9 排序
  • 1.5.10 分布式搜索
  • 1.5.11 过滤器
  • 1.5.12 高亮显示
  • 1.5.13 分页
  • 1.5.14 通过聚合实现分组查询
  • 1.5.15 文本列的聚合
  • 1.5.16 遍历数据
  • 1.5.17 索引文档
  • 1.5.18 Percolate
  • 1.6 RESTClient
  • 1.6.1 使用摄取
  • 1.6.2 代码实现摄取
  • 1.7 使用Jest
  • 1.8 Python客户端
  • 1.9 Scala客户端
  • 1.10 PHP客户端
  • 1.11 SQL支持
  • 1.12 本章小结
  • 第2章 开发插件
  • 2.1 搜索中文
  • 2.1.1 中文分词原理
  • 2.1.2 中文分词插件原理
  • 2.1.3 开发中文分词插件
  • 2.1.4 中文AnalyzerProvider
  • 2.1.5 字词混合索引
  • 2.2 搜索英文
  • 2.2.1 句子切分
  • 2.2.2 标注词性
  • 2.3 使用测试套件
  • 2.4 本章小结
  • 第3章 管理搜索集群
  • 3.1 节点类型
  • 3.2 管理集群
  • 3.3 写入权限控制
  • 3.4 使用X-Pack
  • 3.5 快照
  • 3.6 Zen发现机制
  • 3.7 联合搜索
  • 3.8 缓存
  • 3.9 本章小结
  • 第4章 源码分析
  • 4.1 Lucene源码分析
  • 4.1.1 Ivy管理依赖项
  • 4.1.2 源码结构介绍
  • 4.2 Gradle
  • 4.3 Guice
  • 4.4 Joda-Time
  • 4.5 Transport
  • 4.6 线程池
  • 4.7 模块
  • 4.8 Netty
  • 4.9 分布式
  • 4.10 本章小结
  • 第5章 搜索相关性
  • 5.1 BM25检索模型
  • 5.1.1 使用BM25检索模型
  • 5.1.2 参数调优
  • 5.2 学习评分
  • 5.2.1 基本原理
  • 5.2.2 准备数据
  • 5.2.3 Elasticsearch学习排名
  • 5.3 本章小结
  • 第6章 搜索引擎用户界面
  • 6.1 JSP实现搜索界面
  • 6.1.1 用于显示搜索结果的自定义标签
  • 6.1.2 使用Listlib
  • 6.1.3 实现翻页
  • 6.2 使用Spring实现的搜索界面
  • 6.2.1 实现REST搜索界面
  • 6.2.2 REST API中的HTTP PUT
  • 6.2.3 Spring-data-elasticsearch
  • 6.2.4 Spring HATEOAS
  • 6.3 实现搜索接口
  • 6.3.1 编码识别
  • 6.3.2 布尔搜索
  • 6.3.3 搜索结果排序
  • 6.4 实现相似文档搜索
  • 6.5 实现AJAX搜索联想词
  • 6.5.1 估计查询词的文档频率
  • 6.5.2 搜索联想词总体结构
  • 6.5.3 服务器端处理
  • 6.5.4 浏览器端处理
  • 6.5.5 拼音提示
  • 6.5.6 部署总结
  • 6.5.7 Suggester
  • 6.6 推荐搜索词
  • 6.6.1 挖掘相关搜索词
  • 6.6.2 使用多线程计算相关搜索词
  • 6.7 查询意图理解
  • 6.7.1 拼音搜索
  • 6.7.2 无结果处理
  • 6.8 集成其他功能
  • 6.8.1 拼写检查
  • 6.8.2 分类统计
  • 6.8.3 相关搜索
  • 6.8.4 再次查找
  • 6.8.5 搜索日志
  • 6.9 查询分析
  • 6.9.1 历史搜索词记录
  • 6.9.2 日志信息过滤
  • 6.9.3 信息统计
  • 6.9.4 挖掘日志信息
  • 6.9.5 查询词意图分析
  • 6.10 部署网站
  • 6.10.1 部署到Web服务器
  • 6.10.2 防止攻击
  • 6.11 本章小结
  • 第7章 OCR文字识别
  • 7.1 Tesseract
  • 7.2 使用TensorFlow识别文字
  • 7.3 OpenCV
  • 7.3.1 预处理
  • 7.3.2 文字区域提取
  • 7.3.3 纠正偏斜
  • 7.3.4 Linux环境支持
  • 7.4 JavaCV
  • 7.5 本章小结
  • 第8章 问答式搜索
  • 8.1 生成表示语义的代码
  • 8.2 信息整合
  • 8.2.1 实体对齐
  • 8.2.2 编辑距离
  • 8.2.3 Jaro-Winkler距离
  • 8.2.4 比较器
  • 8.2.5 Cleaner
  • 8.2.6 运行过程
  • 8.2.7 遗传算法调整参数
  • 8.3 自动问答
  • 8.3.1 问句处理器
  • 8.3.2 自动发现答案
  • 8.4 本章小结
  • 第9章 Elastic系统监控
  • 9.1 Logstash
  • 9.1.1 使用Logstash
  • 9.1.2 插件
  • 9.1.3 数据库输入插件
  • 9.2 Filebeat
  • 9.3 消息过期
  • 9.4 Kibana
  • 9.5 Flume
  • 9.6 Kafka
  • 9.7 Graylog
  • 9.8 物联网数据
  • 9.9 本章小结
  • 反侵权盗版声明
展开全部

评分及书评

评分不足
1个评分

出版方

电子工业出版社

电子工业出版社成立于1982年10月,是国务院独资、工信部直属的中央级科技与教育出版社,是专业的信息技术知识集成和服务提供商。经过三十多年的建设与发展,已成为一家以科技和教育出版、期刊、网络、行业支撑服务、数字出版、软件研发、软科学研究、职业培训和教育为核心业务的现代知识服务集团。出版物内容涵盖了电子信息技术的各个分支及工业技术、经济管理、科普与少儿、社科人文等领域,综合出版能力位居全国出版行业前列。