计算机
类型
可以朗读
语音朗读
130千字
字数
2025-04-01
发行日期
展开全部
主编推荐语
系统阐述大模型轻量化的基本理论与实现方法。
内容简介
全书分为3部分,共10章。
第1部分(第1~5章),介绍大模型的背景与面临的问题,以及Transformer和MoE架构的基本原理;重点讲解模型压缩、训练加速和推理优化等核心技术,包括量化、蒸馏和剪枝等,并通过实际案例验证其效果。
第2部分(第6、7章),重点介绍端侧学习与计算引擎优化策略,尤其是动态Batch和异构执行的工程实现。
第3部分(第8~10章),针对高性能算子库与手工算子开发,分别以cuDNN、NEON、CUDA等为代表,揭示算子优化的细节,最后,以国产开源模型DeepSeek-V3为例,展现从训练到推理的综合优化方案。
目录
- 版权信息
- 作者简介
- 内容简介
- 前言
- 第1部分 大模型概述与核心优化技术
- 第1章 大模型基本概念
- 第2章 模型压缩、训练与推理
- 第3章 模型格式转换
- 第4章 图优化
- 第5章 模型压缩
- 第2部分 端侧学习与高效计算引擎优化
- 第6章 端侧学习、端侧推理及计算引擎优化
- 第7章 高性能算子库简介
- 第3部分 高性能算子与深度学习框架应用
- 第8章 常用高性能算子开发实战
- 第9章 TIK、YVM算子原理及其应用
- 第10章 基于DeepSeek-V3分析大模型训练降本增效技术
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。