展开全部

主编推荐语

系统阐述DeepSeek大模型的技术架构、开发实践与行业应用。

内容简介

全书分为3部分11章。

第1~4章深入介绍大模型的理论基础与核心技术,包括大模型的核心概念、Transformer与MoE机制,以及DeepSeek架构的关键设计思想、优化策略与开发基础等。

第5~7章聚焦于实际应用开发,详细讲解如何在DeepSeek平台上构建智能开发工具,包括编程智能助手的技术实现、智能代码生成、调试、多任务跨领域应用以及Prompt设计等。

第8~10章深入探讨了大模型在行业中的定制化应用,通过多个案例展示了大模型如何解决零售、制造等行业中的具体业务问题,帮助读者掌握从需求分析到模型部署的全流程。

第11章详细介绍了DeepSeek-R1的关键技术。

目录

  • 版权信息
  • 作者简介
  • 内容简介
  • 前言
  • 第1部分 理论基础与技术实现
  • 第1章 大模型技术导论
  • 第2章 DeepSeek核心架构解析
  • 第3章 基于DeepSeek的大模型开发基础
  • 第4章 对话生成与语义理解
  • 第2部分 开发实践与技术应用
  • 第5章 智能开发:从文本到代码
  • 第6章 DeepSeek的多任务与跨领域应用
  • 第7章 Prompt设计
  • 第3部分 行业应用与定制化开发
  • 第8章 模型深度优化与部署
  • 第9章 数据构建与自监督学习
  • 第10章 面向工业的定制化模型开发
  • 第11章 全新推理大模型DeepSeek-R1
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

清华大学出版社

清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。