自我提升
类型
可以朗读
语音朗读
127千字
字数
2025-04-01
发行日期
展开全部
主编推荐语
本书系统地介绍多模态大模型的理论基础、关键技术与实际应用。
内容简介
全书分为两部分12章,第1部分(第1~5章)围绕基础理论与技术解析展开论述,包括基本概念、Transformer架构、跨模态对齐、模态融合,以及多模态大模型的预训练方法、模型微调与优化等,为理解多模态大模型的构建逻辑奠定基础。
第2部分(第6~12章)聚集于多模态大模型的高级应用与场景实现,包括主流视觉语言模型(如CLIP、BLIP-2等)的实现、跨模态推理与生成的技术应用、多模态大模型的推理与优化方法、模型的安全与可信性问题,并通过多模态检索与推荐系统、多模态语义理解系统和多模态问答系统的端到端开发实践,展示了多模态大模型的实际落地路径。
目录
- 版权信息
- 作者简介
- 内容简介
- 前言
- 第1部分 基础理论与技术解析
- 第1章 绪论
- 第2章 基础知识
- 第3章 多模态大模型核心架构
- 第4章 多模态大模型的预训练方法
- 第5章 多模态大模型微调与优化
- 第2部分 高级应用与实践探索
- 第6章 视觉语言模型的实现
- 第7章 跨模态推理与生成
- 第8章 多模态大模型的推理优化
- 第9章 多模态大模型的安全问题与可信问题
- 第10章 多模态检索与推荐系统
- 第11章 多模态语义理解系统
- 第12章 多模态问答系统
展开全部
出版方
清华大学出版社
清华大学出版社成立于1980年6月,是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府,秉承清华人“自强不息,厚德载物”的人文精神,清华大学出版社在短短二十多年的时间里,迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向,把出版高等学校教学用书和科技图书作为主要任务,并为促进学术交流、繁荣出版事业设立了多项出版基金,逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色,在教育出版领域树立了强势品牌。