科技
类型
可以朗读
语音朗读
152千字
字数
2024-11-01
发行日期
展开全部
主编推荐语
手把手教你从零构建垂直大模型。
内容简介
本书是一本深度探讨大模型在低算力环境下实现迁移与微调的实践指南,并深入讲解了大模型的部署与优化策略。书中结合多个垂直领域的应用场景,从理论到技术实现,全程详尽讲解了如何应对大模型在行业落地中的技术挑战,帮助读者逐步掌握大模型的迁移与微调核心技术。
目录
- 版权信息
- 前言
- 第1章 垂直领域大模型的行业变革与机遇
- 1.1 大模型下的行业变革
- 1.2 垂直领域大模型迁移的动机
- 1.3 垂直领域大模型迁移的机遇
- 第2章 垂直领域迁移技术栈
- 2.1 垂直领域迁移的方式
- 2.2 低算力微调
- 2.3 推理优化
- 第3章 大模型的开源生态
- 3.1 大模型的开源社区
- 3.2 开源生态下基座模型选择的关键指标
- 3.3 开源基座模型LLaMA系列
- 第4章 自举领域数据的获取
- 4.1 指令自举标注
- 4.2 自举无监督标注
- 4.3 自我策展
- 4.4 自我奖励
- 第5章 数据处理
- 5.1 数据处理的挑战
- 5.2 数据质量
- 5.3 高效数据集访问
- 第6章 大模型抽象
- 6.1 计算图
- 6.2 静态计算图
- 6.3 动态计算图
- 6.4 算子优化与调度
- 6.5 大模型中的张量与算子
- 6.6 大模型的序列化
- 第7章 LoRA低算力微调
- 7.1 LoRA的原理
- 7.2 LoRA的重参数化方法
- 7.3 秩的选择
- 7.4 LoRA的多任务处理策略
- 7.5 LoRA量化版本QLoRA
- 7.6 LoRA微调类型
- 第8章 大模型的分布式训练
- 8.1 分布式训练的挑战
- 8.2 分布式集群架构
- 8.3 分布式训练的通信架构
- 8.4 并行模式
- 8.5 大模型的张量并行
- 8.6 数据并行的内存优化
- 第9章 推理优化技术
- 9.1 计算加速
- 9.2 内存优化
- 9.3 吞吐量优化
- 9.4 量化
- 第10章 大模型的编译优化
- 10.1 深度学习编译与大模型编译
- 10.2 深度学习框架与编译优化
- 10.3 训练阶段的编译优化
- 10.4 端侧部署的编译优化
- 10.5 服务器端部署的编译优化
- 第11章 大模型部署的非性能需求
- 11.1 内容安全
- 11.2 水印
- 11.3 监控
- 11.4 评估
- 第12章 垂直领域大模型的服务器端部署
- 12.1 服务器端部署架构
- 12.2 运行库优化
- 12.3 TGI生产环境解决方案
展开全部
出版方
机械工业出版社
机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。