科技
类型
可以朗读
语音朗读
195千字
字数
2025-02-01
发行日期
展开全部
主编推荐语
一本有关ChatGPT基本原理与核心算法的专著。
内容简介
能够模仿人类语言智能与思维,具有世界一般性知识的ChatGPT,开启了通用人工智能的新时代,正成为引爆第四次工业革命的火种。本书是第一本体系化介绍ChatGPT基本原理与核心算法的教材及专业图书。
全书共分5章:第1章为人工神经网络基础;第2章详细剖析了Transformer及其缘起,分析了视觉领域的Transformer算法;第3章综述了各种大型语言模型框架,分享了创建GPT系列模型的思想之旅;第4章重点介绍了ChatGPT的预训练方法与微调算法,系统地阐述了强化学习基础与基于人类反馈的强化学习;第5章为ChatGPT的应用,包括上下文学习提示与思维链提示,并讨论了智能涌现。
目录
- 版权信息
- 作者简介
- 内容简介
- 前言
- 第1章 人工神经网络基础
- 1.1 引言
- 1.2 人工神经元模型
- 1.3 人工神经网络模型
- 1.4 本章小结
- 第2章 从LSTM到Transformer
- 2.1 引言
- 2.2 递归神经网络:编码器-解码器框架
- 2.3 递归神经网络的注意力与点积相似性
- 2.4 Transformer模型
- 2.5 应用领域:从NLP扩展到CV
- 2.6 本章小结
- 第3章 GPT系列预训练大型语言模型
- 3.1 引言
- 3.2 大型语言模型的Transformer框架
- 3.3 混合式预训练大型语言模型
- 3.4 判别式预训练大型语言模型
- 3.5 GPT系列生成式预训练大型语言模型
- 3.6 本章小结
- 第4章 ChatGPT的大规模预训练与微调
- 4.1 引言
- 4.2 大型语言模型的大规模预训练
- 4.3 ChatGPT预训练模型的微调
- 4.4 性能评估
- 4.5 ChatGPT规模化与工程化中的关键技术
- 4.6 本章小结
- 第5章 ChatGPT的应用
- 5.1 引言
- 5.2 提示工程
- 5.3 上下文学习提示
- 5.4 思维链提示
- 5.5 思维树提示
- 5.6 智能涌现能力
- 5.7 本章小结
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。