3.7 用户推荐指数
科技
类型
可以朗读
语音朗读
237千字
字数
2024-11-01
发行日期
展开全部
主编推荐语
本书由浅入深地介绍了生成式AI的理论与实践。
内容简介
全书内容涉及从基础原理到前沿应用,为读者提供了一个系统的认知框架。本书从生成式AI技术的基础工具入手,逐步深入到Transformer模型与GPT的原理和应用,详细介绍了图像生成模型Stable Diffusion,以及LangChain与AI Agent的相关知识。书中结合开源代码分析,展示了生成式AI在各行各业的实际应用,并探讨了其在高速发展过程中所面临的伦理和隐私风险。
目录
- 版权信息
- 内容提要
- 前言
- 资源与支持
- 第1章 生成式AI基础
- 1.1 技术框架介绍
- 1.1.1 Python
- 1.1.2 TensorFlow
- 1.1.3 PyTorch
- 1.1.4 Hugging Face
- 1.1.5 扩展阅读
- 1.2 常见模型介绍
- 1.2.1 判别式模型
- 1.2.2 生成式模型
- 1.3 数据和任务
- 1.3.1 数据类型
- 1.3.2 常见任务
- 1.4 小结
- 第2章 Transformer和GPT模型
- 2.1 Transformer简介
- 2.1.1 基本概念
- 2.1.2 关键技术
- 2.1.3 变种与扩展
- 2.1.4 资源与工具
- 2.1.5 扩展阅读
- 2.2 GPT模型基础
- 2.2.1 GPT模型的历史背景
- 2.2.2 GPT模型的核心技术
- 2.2.3 扩展阅读
- 2.3 如何使用ChatGPT
- 2.3.1 注册ChatGPT账号
- 2.3.2 ChatGPT操作方法
- 2.3.3 ChatGPT使用技巧
- 2.4 案例一:文本生成
- 2.4.1 初始化
- 2.4.2 加载ELI5数据集
- 2.4.3 预处理
- 2.4.4 训练
- 2.4.5 推理
- 2.5 案例二:文本总结
- 2.5.1 安装
- 2.5.2 加载数据集
- 2.5.3 预处理数据
- 2.5.4 微调模型
- 2.5.5 推理
- 2.6 案例三:文本分类
- 2.6.1 transformers库
- 2.6.2 具体应用
- 2.6.3 实际应用中的挑战
- 第3章 Stable Diffusion
- 3.1 Stable Diffusion简介
- 3.1.1 软件对比
- 3.1.2 计算机配置要求
- 3.1.3 安装步骤
- 3.1.4 基础操作
- 3.1.5 高级功能
- 3.2 Stable Diffusion入门
- 3.2.1 前期准备
- 3.2.2 加载Stable Diffusion
- 3.2.3 可视化Stable Diffusion的内部工作机制
- 3.2.4 Stable Diffusion理论的实际应用
- 3.2.5 Stable Diffusion的内部结构
- 3.3 Stable Diffusion的基础应用
- 3.3.1 从文本生成图像:用文字描绘视觉世界
- 3.3.2 图生图:Stable Diffusion的图像转换魔法
- 3.3.3 图像编辑:用AI技术重塑视觉记忆
- 3.3.4 制作视频:用AI赋予画面动态生命
- 3.4 文生图
- 3.4.1 流行的模型
- 3.4.2 配置pipeline参数
- 3.4.3 控制图像生成
- 3.4.4 优化操作
- 3.5 图生图
- 3.5.1 快速入门
- 3.5.2 流行的模型
- 3.5.3 配置pipeline参数
- 3.5.4 链式图像到图像pipeline
- 3.5.5 控制图像生成
- 3.6 图像修复
- 3.6.1 使用Diffusers进行图像修复
- 3.6.2 常用的模型
- 3.6.3 非特定修复的checkpoint
- 3.6.4 配置pipeline参数
- 3.6.5 串联修复pipeline
- 3.6.6 控制图像生成
- 3.7 小结
- 第4章 LangChain与AI Agent
- 4.1 LangChain与AI Agent简介
- 4.1.1 LangChain架构
- 4.1.2 使用LangChain构建AI Agent示例
- 4.2 LangChain关键组件
- 4.2.1 Module I/O
- 4.2.2 Retrieval
- 4.2.3 Agent
- 4.3 LCEL入门
- 4.4 LCEL的使用示例
- 4.4.1 基础原理
- 4.4.2 常用方式
- 4.5 RAG基础应用
- 4.5.1 RAG架构
- 4.5.2 设置
- 4.5.3 详细分析
- 4.6 Agent基础应用
- 4.6.1 搭建Agent
- 4.6.2 创建工具
- 4.6.3 创建提示
- 4.6.4 构建Agent
- 4.6.5 调用Agent
- 4.7 高级RAG应用程序
- 4.7.1 高级应用示例——添加聊天记录
- 4.7.2 构建环境
- 4.7.3 没有聊天历史的链条
- 4.7.4 情境化问题
- 4.7.5 有聊天历史的链条
- 4.8 小结
- 第5章 生成式AI开源应用案例
- 5.1 文本转博客
- 5.1.1 核心技术
- 5.1.2 应用与部署
- 5.2 智能填表QuickFill
- 5.2.1 页面介绍
- 5.2.2 用户使用指南
- 5.2.3 部署项目
- 5.3 使用Transformer处理多模态大语言模型
- 5.3.1 配置教程
- 5.3.2 使用Transformer
- 5.3.3 使用ModelScope
- 5.4 3D生成:Stable Diffusion和Generative Gaussian Splatting方法
- 5.4.1 配置流程
- 5.4.2 运行示例
- 5.4.3 关键原理解释
- 5.5 视频生成
- 5.5.1 简介
- 5.5.2 视频生成的原理
- 5.5.3 视频生成实践
- 5.5.4 视频优化
- 5.5.5 视频生成工具
- 5.5.6 视频生成的挑战
- 第6章 生成式AI行业应用
- 6.1 跨媒体内容创作
- 6.1.1 文本与图像结合
- 6.1.2 文本和视频结合
- 6.1.3 多媒体内容创作
- 6.2 商业广告设计
- 6.2.1 创新广告策略
- 6.2.2 定制化设计方法
- 6.3 金融应用
- 6.3.1 个性化的消费者体验
- 6.3.2 合规
- 6.3.3 风险管理
- 6.3.4 动态预测和报告
- 6.3.5 挑战
- 6.4 教育应用
- 6.4.1 学习体验定制
- 6.4.2 教育内容创新
- 6.4.3 赋能教师端
- 6.4.4 AI在教育中的挑战与局限性
- 6.5 在健康领域的应用
- 6.5.1 解决医疗资源获取和成本的问题
- 6.5.2 应用场景
- 6.5.3 新型医疗保健公司的市场
- 第7章 生成式AI伦理道德
- 7.1 常见的生成式AI伦理道德问题
- 7.1.1 质量与性能
- 7.1.2 偏见与公平性
- 7.1.3 隐私
- 7.2 数据模型角度的分析
- 7.2.1 数据泄露
- 7.2.2 内容审查/有害内容
- 7.2.3 提示注入/防御
- 7.2.4 模型操纵
- 7.2.5 可解释性和透明度
- 7.3 一般性解决方案
- 7.3.1 Responsible AI在大语言模型应用开发中的应用
- 7.3.2 在大语言模型中建立防护栏
- 7.3.3 构建值得信赖的AI未来
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。