人工智能
类型
可以朗读
语音朗读
299千字
字数
2026-01-01
发行日期
展开全部
主编推荐语
项目驱动全面解析AI智能体开发核心技术。
内容简介
本书较为全面地讲解AI智能体开发的关键技术,包括提示词工程、Function Calling、MCP、RAG知识库、语音识别、人脸识别、大模型应用等,同时结合蜗牛学苑的自研项目和教学案例,将所有技术融入项目中,以项目驱动的方式进行讲解,以便读者更好地理解AI智能体开发技术。
本书第1章主要讲解在Python中对接各类大模型,以及智能体开发所使用的Function Calling技术和MCP技术;第2章主要讲解FastAPI开发框架;第3章主要讲解基于网页对话来实现AI问答功能;第4章主要讲解每日新闻摘要功能的实现;第5章主要讲解智能语音记分功能的实现;第6章主要讲解智能考勤功能的实现;第7章主要讲解AI智慧课堂功能的实现;第8章主要讲解智能在线客服功能的实现。
目录
- 版权信息
- 内容提要
- 前言
- 第1章 大模型与智能体开发
- 本章引言
- 1.1 对接云端大模型接口
- 1.1.1 准备PyCharm开发环境
- 1.1.2 对接通义千问
- 1.1.3 对接DeepSeek
- 1.1.4 对接OpenRouter平台
- 1.2 本地部署大模型
- 1.2.1 安装与配置Ollama
- 1.2.2 拉取并测试大模型
- 1.2.3 CherryStudio对接Ollama
- 1.2.4 调用Ollama API
- 1.3 AI智能体开发技术
- 1.3.1 Function Calling技术
- 1.3.2 MCP技术
- 1.3.3 使用Python调用Function Calling
- 1.3.4 使用Python开发MCP服务
- 第2章 FastAPI开发框架
- 本章引言
- 2.1 FastAPI快速使用
- 2.1.1 快速入门
- 2.1.2 URL及参数
- 2.1.3 RESTful接口
- 2.1.4 JSON请求体
- 2.1.5 会话管理
- 2.1.6 文件上传
- 2.1.7 数据验证
- 2.1.8 异步编程
- 2.2 Jinja2模板引擎
- 2.2.1 模板引擎的作用
- 2.2.2 Jinja2快速使用
- 2.2.3 Jinja2核心语法
- 2.2.4 过滤器
- 2.2.5 应用示例
- 2.3 SQLModel数据处理
- 2.3.1 利用PyMySQL操作数据库
- 2.3.2 SQLModel核心操作
- 2.3.3 SQLModel复杂查询
- 2.4 FastAPI对接大模型
- 2.4.1 基于OpenAI库对接
- 2.4.2 处理流式响应
- 2.4.3 前端JavaScript对接
- 第3章 AI问答
- 本章引言
- 3.1 功能与设计分析
- 3.1.1 核心功能列表
- 3.1.2 整体实现思路
- 3.2 前后端准备工作
- 3.2.1 前端界面实现
- 3.2.2 静态目录设置
- 3.2.3 FastAPI多模块
- 3.3 文本问答功能
- 3.3.1 后端代码实现
- 3.3.2 前端代码实现
- 3.3.3 联网搜索功能
- 3.3.4 开发MCP客户端
- 3.3.5 函数调用增强
- 3.4 图像识别与生成
- 3.4.1 图像识别功能
- 3.4.2 图像识别前端
- 3.4.3 图像生成功能
- 第4章 每日新闻摘要
- 本章引言
- 4.1 功能与设计分析
- 4.1.1 核心功能列表
- 4.1.2 整体实现思路
- 4.2 基础功能实现
- 4.2.1 前端界面布局
- 4.2.2 数据表结构
- 4.2.3 BeautifulSoup库
- 4.2.4 爬取标题与超链接
- 4.2.5 获取和摘要新闻
- 4.2.6 前端界面渲染
- 4.3 扩展功能实现
- 4.3.1 新闻分类浏览
- 4.3.2 按日期浏览新闻
- 4.3.3 定时更新新闻
- 第5章 智能语音记分
- 本章引言
- 5.1 语音识别与合成
- 5.1.1 本地录音文件识别
- 5.1.2 本地实时语音识别
- 5.1.3 阿里云语音识别
- 5.1.4 WebSocket通信
- 5.1.5 JavaScript语音识别
- 5.1.6 语音合成与播放
- 5.2 Web版语音记分
- 5.2.1 功能与实现思路
- 5.2.2 前端界面实现
- 5.2.3 前端JavaScript代码实现
- 5.2.4 后台代码实现
- 5.3 Python版语音记分
- 5.3.1 tkinter绘制界面
- 5.3.2 语音唤醒功能
- 5.3.3 完整功能代码
- 第6章 智能考勤
- 本章引言
- 6.1 需求与设计分析
- 6.1.1 核心功能列表
- 6.1.2 整体实现思路
- 6.1.3 face_recognition的用法
- 6.2 OpenCV版本实现
- 6.2.1 利用OpenCV采集摄像头数据
- 6.2.2 人脸数据存储与对比
- 6.2.3 设计智能考勤系统数据表
- 6.2.4 实现新增人脸数据功能
- 6.2.5 实现人脸考勤功能
- 6.2.6 实现Web端考勤数据查询功能
- 6.3 Web端版本实现
- 6.3.1 前端采集摄像头数据
- 6.3.2 基于WebSocket进行实时检测
- 6.3.3 基于前端界面进行考勤
- 6.3.4 打卡成功并显示考勤记录
- 6.4 活体检测防作弊
- 6.4.1 活体检测概述
- 6.4.2 人脸68个关键特征点
- 6.4.3 指令动作检测原理
- 6.4.4 活体检测核心代码
- 6.4.5 前端连续截图测试
- 6.4.6 活体检测与考勤
- 第7章 AI智慧课堂
- 本章引言
- 7.1 功能与设计分析
- 7.1.1 核心功能列表
- 7.1.2 整体实现思路
- 7.1.3 数据库设计
- 7.2 主体功能开发
- 7.2.1 视频文件预处理
- 7.2.2 生成课堂笔记
- 7.2.3 生成思维导图
- 7.2.4 生成视频关键帧
- 7.2.5 拓展知识引用
- 7.3 出题和考试功能
- 7.3.1 生成考题
- 7.3.2 前端渲染考题
- 7.3.3 提交试卷并评分
- 7.4 登录与Token鉴权
- 7.4.1 Token处理机制
- 7.4.2 加密与解密处理
- 7.4.3 登录与Token认证
- 7.4.4 前后端校验处理
- 7.5 定时任务处理
- 第8章 智能在线客服
- 本章引言
- 8.1 功能与设计分析
- 8.1.1 RAG与向量数据库
- 8.1.2 核心功能列表
- 8.1.3 整体实现思路
- 8.2 LlamaIndex框架应用
- 8.2.1 LlamaIndex概述
- 8.2.2 LlamaIndex核心操作
- 8.2.3 文档分段与检索
- 8.2.4 定义提示词模板
- 8.2.5 处理流式响应
- 8.2.6 文档分段策略
- 8.2.7 检索结果重排序
- 8.3 向量数据库
- 8.3.1 Chroma的核心操作
- 8.3.2 自行分段实现RAG
- 8.3.3 Chroma的其他操作
- 8.3.4 LlamaIndex整合Chroma
- 8.3.5 Qdrant的核心操作
- 8.3.6 LlamaIndex整合Qdrant
- 8.4 项目功能实现
- 8.4.1 Web前端实现
- 8.4.2 用户端功能实现
- 8.4.3 文档上传并建立索引
- 8.4.4 文档信息处理
- 8.4.5 文档分段内容查看
- 8.5 扩展功能优化
- 8.5.1 联网搜索并回复
- 8.5.2 联系方式自动通知
- 8.5.3 保存对话记录
- 8.5.4 对接云端知识库
- 8.5.5 使用大模型进行分段
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。
