科技
类型
可以朗读
语音朗读
300千字
字数
2025-07-01
发行日期
展开全部
主编推荐语
全面展示从NLP词嵌入到Transformer架构的完整技术演进脉络。
内容简介
本书全面、系统、深入地介绍自然语言处理(NLP)的核心知识与实践方法,涵盖从传统模型到基于Transformer架构的大语言模型的完整知识体系。
本书通过理论推导与Python代码实践相结合的方式,深入解析词嵌入、句法分析、序列建模等基础技术,并重点探讨Transformer架构、预训练范式、生成控制与RLHF对齐等大语言模型的关键技术。书中结合多个Python实践案例与伦理问题,帮助读者掌握“基础理论→算法实现→应用落地”的NLP任务构建全栈能力。
目录
- 版权信息
- 内容简介
- 作者简介
- 前言
- 第1篇 自然语言处理基础与词表示
- 第1章 自然语言处理基础与词嵌入
- 1.1 自然语言处理概述
- 1.2 词袋模型
- 1.3 词向量和词嵌入
- 1.4 词嵌入方法
- 1.5 Word2Vec和GloVe比较
- 1.6 自然语言处理中的词向量评估方法
- 参考文献
- 第2章 神经网络基础
- 2.1 神经网络单元
- 2.2 前馈计算
- 2.3 最大间隔目标函数
- 2.4 反向传播
- 2.5 神经网络的算法实现
- 2.6 神经网络的激活函数
- 2.7 数据预处理
- 2.8 参数初始化
- 2.9 学习率
- 2.10 梯度下降优化算法
- 2.11 神经网络的验证及调整方法
- 参考文献
- 第3章 朴素贝叶斯在情感分类中的作用
- 3.1 文本分类的基本概念
- 3.2 朴素贝叶斯分类器
- 参考文献
- 第4章 语言建模任务和N-gram模型
- 4.1 语言建模简介
- 4.2 N-gram模型简介
- 4.3 N-gram模型的评价方法
- 4.4 N-gram模型的主要问题及其解决方法
- 参考文献
- 第2篇 语言结构与句法解析
- 第5章 上下文无关语法和成分解析
- 5.1 句法分析的意义
- 5.2 上下文无关语法
- 5.3 树库
- 5.4 语法等价性和范式
- 5.5 句法解析器和结构歧义
- 5.6 CKY解析
- 5.7 处理歧义:概率上下文无关文法
- 5.8 最佳优先概率解析
- 5.9 解析的评价方法
- 参考文献
- 第6章 依存句法分析
- 6.1 构成成分和依存结构的区别与联系
- 6.2 依存结构的基本概念
- 6.3 依存关系的确立
- 6.4 基于转移的依存句法分析
- 6.5 神经网络依存句法分析器
- 参考文献
- 第3篇 序列建模与深度学习方法
- 第7章 循环神经网络
- 7.1 神经概率语言模型简介
- 7.2 循环神经网络的原理、评估与优化策略
- 参考文献
- 第8章 长短期记忆网络与门控循环单元
- 8.1 长短期记忆网络
- 8.2 门控循环单元
- 参考文献
- 第9章 序列到序列模型
- 9.1 机器翻译概述
- 9.2 序列到序列模型的基本原理与实现
- 9.3 注意力机制
- 9.4 序列到序列模型的评估方法
- 参考文献
- 第10章 注意力机制与Transformer架构
- 10.1 注意力机制的基本原理、局限性与改进
- 10.2 Transformer的关键组件
- 10.3 Transformer的编码器与解码器结构
- 10.4 Transformer的应用场景
- 10.5 Transformer的应用成果、复杂度与发展趋势
- 参考文献
- 第4篇 大语言模型与生成技术
- 第11章 自然语言生成
- 11.1 自然语言生成的不同任务类型
- 11.2 自然语言生成的基础
- 11.3 自然语言生成的解码过程
- 11.4 解码遇到的问题及其解决方案
- 11.5 自然语言生成的训练过程
- 11.6 评估指标
- 11.7 自然语言生成的评价方法
- 11.8 自然语言生成的伦理问题
- 参考文献
- 第12章 大语言模型预处理与基于人类反馈的强化学习
- 12.1 子词模型
- 12.2 整体模型训练
- 12.3 编码器的预训练方法
- 12.4 编码器-解码器的预训练方法
- 12.5 解码器的预训练方法
- 12.6 大语言模型的优化:提示工程与基于人类反馈的强化学习
- 参考文献
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。
