《Transformer大模型：原理、实践及应用》电子书在线阅读-陈喆-得到APP

人工智能类型

可以朗读语音朗读

96千字字数

2025-10-01 发行日期

展开全部

主编推荐语

全面解析Transformer架构，示范多领域应用，47个实验助力实践与深度学习。

内容简介

Transformer是大语言模型等大模型的现阶段主要架构。

本书从原理的角度系统地讲解序列监督学习、序列聚合、注意力机制、Transformer层及3种类型的Transformer架构，从应用的角度讲解并演示如何在自然语言处理、计算机视觉、信号处理、推荐系统、深度强化学习等领域使用Transformer架构完成文本分类、文本生成、机器翻译、语音识别、语音合成、图像分类、图像说明、视频分类、视频预测等任务，并从实践的角度通过47个循序渐进的实验引领读者使用PyTorch框架独立编程实现上述方法和架构，完成上述任务。

本书不仅适合作为相关专业本科生及研究生的专业课教材，也适合相关领域的从业者、科研人员及大模型应用爱好者参考。

评分及书评

尚无评分

目前还没人评分

出版方

清华大学出版社

清华大学出版社成立于1980年6月，是由教育部主管、清华大学主办的综合出版单位。植根于“清华”这座久负盛名的高等学府，秉承清华人“自强不息，厚德载物”的人文精神，清华大学出版社在短短二十多年的时间里，迅速成长起来。清华大学出版社始终坚持弘扬科技文化产业、服务科教兴国战略的出版方向，把出版高等学校教学用书和科技图书作为主要任务，并为促进学术交流、繁荣出版事业设立了多项出版基金，逐渐形成了以出版高水平的教材和学术专著为主的鲜明特色，在教育出版领域树立了强势品牌。