展开全部

主编推荐语

一本有关ChatGPT基本原理与核心算法的专著。

内容简介

能够模仿人类语言智能与思维,具有世界一般性知识的ChatGPT,开启了通用人工智能的新时代,正成为引爆第四次工业革命的火种。本书是第一本体系化介绍ChatGPT基本原理与核心算法的教材及专业图书。

全书共分5章:第1章为人工神经网络基础;第2章详细剖析了Transformer及其缘起,分析了视觉领域的Transformer算法;第3章综述了各种大型语言模型框架,分享了创建GPT系列模型的思想之旅;第4章重点介绍了ChatGPT的预训练方法与微调算法,系统地阐述了强化学习基础与基于人类反馈的强化学习;第5章为ChatGPT的应用,包括上下文学习提示与思维链提示,并讨论了智能涌现。

目录

  • 版权信息
  • 作者简介
  • 内容简介
  • 前言
  • 第1章 人工神经网络基础
  • 1.1 引言
  • 1.2 人工神经元模型
  • 1.3 人工神经网络模型
  • 1.4 本章小结
  • 第2章 从LSTM到Transformer
  • 2.1 引言
  • 2.2 递归神经网络:编码器-解码器框架
  • 2.3 递归神经网络的注意力与点积相似性
  • 2.4 Transformer模型
  • 2.5 应用领域:从NLP扩展到CV
  • 2.6 本章小结
  • 第3章 GPT系列预训练大型语言模型
  • 3.1 引言
  • 3.2 大型语言模型的Transformer框架
  • 3.3 混合式预训练大型语言模型
  • 3.4 判别式预训练大型语言模型
  • 3.5 GPT系列生成式预训练大型语言模型
  • 3.6 本章小结
  • 第4章 ChatGPT的大规模预训练与微调
  • 4.1 引言
  • 4.2 大型语言模型的大规模预训练
  • 4.3 ChatGPT预训练模型的微调
  • 4.4 性能评估
  • 4.5 ChatGPT规模化与工程化中的关键技术
  • 4.6 本章小结
  • 第5章 ChatGPT的应用
  • 5.1 引言
  • 5.2 提示工程
  • 5.3 上下文学习提示
  • 5.4 思维链提示
  • 5.5 思维树提示
  • 5.6 智能涌现能力
  • 5.7 本章小结
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

清华大学出版社

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。