展开全部

主编推荐语

资深算法工程师多年NLP算法与模型研究经验总结。

内容简介

本书结合多个真实的落地项目,从自然语言处理(NLP)的任务视角,分门别类地介绍现阶段各NLP任务中深度学习的应用。以任务视角是指以一个个场景项目为视角,这样做可以获得更多的实战经验。本书的每一章都有核心模型的先验链条,这对理解和掌握NLP模型非常有帮助。

本书分为9章,对应9种NLP任务。

第1章介绍分词和词性标注任务。第2章介绍文本分类任务,如情感分析、文章分类与打标签等都是常见的文本分类任务。第3章介绍命名实体识别任务,如提取内容中的姓名和公司名称等,在知识图谱、内容结构化和智能对话等场景中也是该任务的具体应用。

第4章介绍神经机器翻译任务,它是NLP最先商用的独立任务场景。第5章介绍文本纠错任务,它是应用非常广泛的一类NLP任务,因为凡是涉及用户输入的场景或多或少都需要用到纠错任务,否则用户体验就会很差。第6章介绍机器阅读理解任务,该任务偏学术,在实践中往往属于某个大任务下的子任务。

第7章介绍句法分析任务,它是NLP中非常传统的任务。第8章介绍文本摘要任务,该类任务在新闻类业务场景中使用较多。第9章介绍信息检索和问答系统任务,凡是类似于搜索和输入这类需要等待回复的场景都可以归为该任务。

目录

  • 版权信息
  • 内容简介
  • 作者简介
  • 前言
  • 第1章 分词和词性标注
  • 1.1 为什么要学习分词
  • 1.2 分词的传统算法
  • 1.3 深度学习在分词中的应用
  • 1.4 为什么要学习已经过时的模型
  • 1.5 BERT之后的中文分词还有必要用吗
  • 1.6 如何做词性标注
  • 1.7 大模型时代的分词和词性标注
  • 1.8 小结
  • 第2章 文本分类
  • 2.1 文本分类的应用
  • 2.2 文本分类的词向量方法
  • 2.3 文本分类的深度学习方法
  • 2.4 分类任务数据集
  • 2.5 大模型时代的文本分类
  • 2.6 小结
  • 第3章 命名实体识别
  • 3.1 什么是NER
  • 3.2 传统的NER方法
  • 3.3 深度学习在NER中的应用
  • 3.4 大模型时代的命名实体识别
  • 3.5 小结
  • 第4章 神经机器翻译
  • 4.1 神经机器翻译的发展
  • 4.2 评估指标
  • 4.3 神经机器翻译概述
  • 4.4 注意力机制
  • 4.5 NMT经典模型——Transformer
  • 4.6 NMT前沿研究
  • 4.7 大模型时代的神经机器翻译
  • 4.8 小结
  • 第5章 文本纠错
  • 5.1 纠错概述
  • 5.2 英文纠错
  • 5.3 拼音纠错
  • 5.4 中文纠错
  • 5.5 中文纠错实践
  • 5.6 基于NMT的纠错简介
  • 5.7 大模型时代的文本纠错
  • 5.8 小结
  • 第6章 机器阅读理解
  • 6.1 MRC综述
  • 6.2 MRC数据集
  • 6.3 常见的MRC模型
  • 6.4 大模型时代的机器阅读理解
  • 6.5 小结
  • 第7章 句法分析
  • 7.1 句法分析概述
  • 7.2 短语句法分析
  • 7.3 依存句法分析
  • 7.4 依存句法分析方法
  • 7.5 深度学习与句法分析的结合
  • 7.6 依存句法分析在评论分析中的一种应用
  • 7.7 深度学习模型在NLP中何时需要树形结构
  • 7.8 大模型时代的句法分析
  • 7.9 小结
  • 第8章 文本摘要
  • 8.1 文本摘要概述
  • 8.2 传统的摘要方法
  • 8.3 抽取式模型
  • 8.4 生成式模型
  • 8.5 大模型时代的文本摘要
  • 8.6 小结
  • 第9章 信息检索和问答系统
  • 9.1 传统的检索方法
  • 9.2 QA概述
  • 9.3 用神经网络计算问题与答案的相关性
  • 9.4 表征式模型
  • 9.5 交互式模型
  • 9.6 混合式
  • 9.7 大模型时代的信息检索和问答系统
  • 9.8 小结
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

清华大学出版社

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。