展开全部

主编推荐语

本书由浅入深地介绍了生成式AI的理论与实践。

内容简介

全书内容涉及从基础原理到前沿应用,为读者提供了一个系统的认知框架。本书从生成式AI技术的基础工具入手,逐步深入到Transformer模型与GPT的原理和应用,详细介绍了图像生成模型Stable Diffusion,以及LangChain与AI Agent的相关知识。书中结合开源代码分析,展示了生成式AI在各行各业的实际应用,并探讨了其在高速发展过程中所面临的伦理和隐私风险。

目录

  • 版权信息
  • 内容提要
  • 前言
  • 资源与支持
  • 第1章 生成式AI基础
  • 1.1 技术框架介绍
  • 1.1.1 Python
  • 1.1.2 TensorFlow
  • 1.1.3 PyTorch
  • 1.1.4 Hugging Face
  • 1.1.5 扩展阅读
  • 1.2 常见模型介绍
  • 1.2.1 判别式模型
  • 1.2.2 生成式模型
  • 1.3 数据和任务
  • 1.3.1 数据类型
  • 1.3.2 常见任务
  • 1.4 小结
  • 第2章 Transformer和GPT模型
  • 2.1 Transformer简介
  • 2.1.1 基本概念
  • 2.1.2 关键技术
  • 2.1.3 变种与扩展
  • 2.1.4 资源与工具
  • 2.1.5 扩展阅读
  • 2.2 GPT模型基础
  • 2.2.1 GPT模型的历史背景
  • 2.2.2 GPT模型的核心技术
  • 2.2.3 扩展阅读
  • 2.3 如何使用ChatGPT
  • 2.3.1 注册ChatGPT账号
  • 2.3.2 ChatGPT操作方法
  • 2.3.3 ChatGPT使用技巧
  • 2.4 案例一:文本生成
  • 2.4.1 初始化
  • 2.4.2 加载ELI5数据集
  • 2.4.3 预处理
  • 2.4.4 训练
  • 2.4.5 推理
  • 2.5 案例二:文本总结
  • 2.5.1 安装
  • 2.5.2 加载数据集
  • 2.5.3 预处理数据
  • 2.5.4 微调模型
  • 2.5.5 推理
  • 2.6 案例三:文本分类
  • 2.6.1 transformers库
  • 2.6.2 具体应用
  • 2.6.3 实际应用中的挑战
  • 第3章 Stable Diffusion
  • 3.1 Stable Diffusion简介
  • 3.1.1 软件对比
  • 3.1.2 计算机配置要求
  • 3.1.3 安装步骤
  • 3.1.4 基础操作
  • 3.1.5 高级功能
  • 3.2 Stable Diffusion入门
  • 3.2.1 前期准备
  • 3.2.2 加载Stable Diffusion
  • 3.2.3 可视化Stable Diffusion的内部工作机制
  • 3.2.4 Stable Diffusion理论的实际应用
  • 3.2.5 Stable Diffusion的内部结构
  • 3.3 Stable Diffusion的基础应用
  • 3.3.1 从文本生成图像:用文字描绘视觉世界
  • 3.3.2 图生图:Stable Diffusion的图像转换魔法
  • 3.3.3 图像编辑:用AI技术重塑视觉记忆
  • 3.3.4 制作视频:用AI赋予画面动态生命
  • 3.4 文生图
  • 3.4.1 流行的模型
  • 3.4.2 配置pipeline参数
  • 3.4.3 控制图像生成
  • 3.4.4 优化操作
  • 3.5 图生图
  • 3.5.1 快速入门
  • 3.5.2 流行的模型
  • 3.5.3 配置pipeline参数
  • 3.5.4 链式图像到图像pipeline
  • 3.5.5 控制图像生成
  • 3.6 图像修复
  • 3.6.1 使用Diffusers进行图像修复
  • 3.6.2 常用的模型
  • 3.6.3 非特定修复的checkpoint
  • 3.6.4 配置pipeline参数
  • 3.6.5 串联修复pipeline
  • 3.6.6 控制图像生成
  • 3.7 小结
  • 第4章 LangChain与AI Agent
  • 4.1 LangChain与AI Agent简介
  • 4.1.1 LangChain架构
  • 4.1.2 使用LangChain构建AI Agent示例
  • 4.2 LangChain关键组件
  • 4.2.1 Module I/O
  • 4.2.2 Retrieval
  • 4.2.3 Agent
  • 4.3 LCEL入门
  • 4.4 LCEL的使用示例
  • 4.4.1 基础原理
  • 4.4.2 常用方式
  • 4.5 RAG基础应用
  • 4.5.1 RAG架构
  • 4.5.2 设置
  • 4.5.3 详细分析
  • 4.6 Agent基础应用
  • 4.6.1 搭建Agent
  • 4.6.2 创建工具
  • 4.6.3 创建提示
  • 4.6.4 构建Agent
  • 4.6.5 调用Agent
  • 4.7 高级RAG应用程序
  • 4.7.1 高级应用示例——添加聊天记录
  • 4.7.2 构建环境
  • 4.7.3 没有聊天历史的链条
  • 4.7.4 情境化问题
  • 4.7.5 有聊天历史的链条
  • 4.8 小结
  • 第5章 生成式AI开源应用案例
  • 5.1 文本转博客
  • 5.1.1 核心技术
  • 5.1.2 应用与部署
  • 5.2 智能填表QuickFill
  • 5.2.1 页面介绍
  • 5.2.2 用户使用指南
  • 5.2.3 部署项目
  • 5.3 使用Transformer处理多模态大语言模型
  • 5.3.1 配置教程
  • 5.3.2 使用Transformer
  • 5.3.3 使用ModelScope
  • 5.4 3D生成:Stable Diffusion和Generative Gaussian Splatting方法
  • 5.4.1 配置流程
  • 5.4.2 运行示例
  • 5.4.3 关键原理解释
  • 5.5 视频生成
  • 5.5.1 简介
  • 5.5.2 视频生成的原理
  • 5.5.3 视频生成实践
  • 5.5.4 视频优化
  • 5.5.5 视频生成工具
  • 5.5.6 视频生成的挑战
  • 第6章 生成式AI行业应用
  • 6.1 跨媒体内容创作
  • 6.1.1 文本与图像结合
  • 6.1.2 文本和视频结合
  • 6.1.3 多媒体内容创作
  • 6.2 商业广告设计
  • 6.2.1 创新广告策略
  • 6.2.2 定制化设计方法
  • 6.3 金融应用
  • 6.3.1 个性化的消费者体验
  • 6.3.2 合规
  • 6.3.3 风险管理
  • 6.3.4 动态预测和报告
  • 6.3.5 挑战
  • 6.4 教育应用
  • 6.4.1 学习体验定制
  • 6.4.2 教育内容创新
  • 6.4.3 赋能教师端
  • 6.4.4 AI在教育中的挑战与局限性
  • 6.5 在健康领域的应用
  • 6.5.1 解决医疗资源获取和成本的问题
  • 6.5.2 应用场景
  • 6.5.3 新型医疗保健公司的市场
  • 第7章 生成式AI伦理道德
  • 7.1 常见的生成式AI伦理道德问题
  • 7.1.1 质量与性能
  • 7.1.2 偏见与公平性
  • 7.1.3 隐私
  • 7.2 数据模型角度的分析
  • 7.2.1 数据泄露
  • 7.2.2 内容审查/有害内容
  • 7.2.3 提示注入/防御
  • 7.2.4 模型操纵
  • 7.2.5 可解释性和透明度
  • 7.3 一般性解决方案
  • 7.3.1 Responsible AI在大语言模型应用开发中的应用
  • 7.3.2 在大语言模型中建立防护栏
  • 7.3.3 构建值得信赖的AI未来
展开全部

评分及书评

3.7
3个评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。