互联网
类型
可以朗读
语音朗读
220千字
字数
No.22
科学技术
2025-05-01
发行日期
展开全部
主编推荐语
一本书掌握数据资产管理、数据底座技术、AI安全与大模型应用选型。
内容简介
本书旨在帮助数据行业的从业者在AI时代提升数据管理和数据技术认知水平,内容覆盖数据价值创造的理论、技术和实践。
本书共8章。第1章回顾企业数据的发展历史,并讲解现代企业数据组织。第2章从多维度解析数据价值的创造路径,包括从构建数字化决策、加速业务创新和推动AI变革等视角介绍数据价值创造的方法和成果。
第3章系统讲解数据管理的方法与技术,包括数据资产管理、数据资产运营、数据平台架构的规划及实践案例。第4章讲解数据要素价值化的路径探索,包括数据要素在多行业的应用、基础体系、可信数据流通技术及数据资产入表。
第5章讲解数据底座的技术与实践,包括数据底座的架构要求、分布式存储技术、分布式计算技术等,以及多种架构介绍。第6章讲解数据与AI的融合,包括推荐系统、基于LLM的数据治理分析、数据标注等。
第7章介绍企业AI应用的方法论与知识融合。第8章是数据领域技术趋势与思考,包括数据技术的自主可控、开源技术的发展与挑战、数据中台的发展历程与思考、数据编织技术的原理与展望。
目录
- 版权信息
- 内容提要
- 作者介绍
- 推荐序
- 前言
- 第1章 数字化与信息化
- 1.1 数据与信息
- 1.2 数据处理的起源
- 1.3 数字化的数据处理
- 1.3.1 从机械化到数字化
- 1.3.2 从数据处理到信息系统
- 1.3.3 面向记录事务的数据管理
- 1.4 数据管理与分析
- 1.5 商业智能与数据科学
- 1.6 数据可视化
- 1.7 现代企业数据组织
- 1.7.1 数据工程师
- 1.7.2 数据分析师
- 1.7.3 数据科学家
- 1.7.4 数据管理人员
- 第2章 数据价值的创造路径
- 2.1 数据分析创造价值
- 2.1.1 企业数据价值创造的阶段化路径
- 2.1.2 国内数字化的行业观察
- 2.2 数据价值:数字化决策
- 2.2.1 运营管理的数字化
- 2.2.2 风险管理的数字化
- 2.2.3 营销获客的数字化
- 2.3 数据价值:业务创新
- 2.3.1 线下业务转线上
- 2.3.2 监管的数字化
- 2.4 数据价值:推动AI变革
- 2.4.1 ImageNet
- 2.4.2 数字疗法
- 2.5 数据价值创造的组织保障
- 2.5.1 数据管理团队能力建设
- 2.5.2 数据产品团队能力建设
- 2.5.3 数据底座团队能力建设
- 第3章 数据管理的方法与技术
- 3.1 数据资产管理
- 3.1.1 数据模型管理
- 3.1.2 数据标准管理
- 3.1.3 数据质量管理
- 3.1.4 主数据管理
- 3.1.5 元数据管理
- 3.1.6 数据安全管理
- 3.1.7 数据资产管理平台
- 3.2 数据资产运营
- 3.2.1 数据可视化
- 3.2.2 商业智能
- 3.2.3 数据洞察
- 3.2.4 数据标签
- 3.2.5 数据指标
- 3.2.6 数据资产盘点与编目
- 3.2.7 数据资产运营平台
- 3.3 数据平台架构
- 3.3.1 数据仓库
- 3.3.2 数据湖
- 3.3.3 数据集市
- 3.3.4 数据中台
- 3.4 中国联通的数据运营体系
- 3.4.1 数据运营体系的建设由来
- 3.4.2 数据运营的规范统一
- 3.4.3 统一工具支撑“一体化运营”
- 3.4.4 “一套数据管理体系”保障数据供给
- 第4章 数据要素价值化的路径探索
- 4.1 数据要素:数据价值的产业化
- 4.1.1 数据要素×医疗健康
- 4.1.2 数据要素×金融服务
- 4.1.3 数据要素×智慧农业
- 4.1.4 数据要素×气象服务
- 4.2 数据要素的基础体系
- 4.2.1 数据基础设施
- 4.2.2 数据基础制度
- 4.3 可信数据流通技术
- 4.3.1 数据空间
- 4.3.2 其他技术路径
- 4.4 数据资产入表
- 4.4.1 数据资产的确认
- 4.4.2 数据资产的会计计量
- 4.4.3 数据资源入表管理平台
- 第5章 数据底座的技术与实践
- 5.1 数据底座的架构要求
- 5.1.1 数据底座的能力要求
- 5.1.2 数据底座的核心功能
- 5.2 分布式存储技术
- 5.2.1 分布式文件存储HDFS
- 5.2.2 对象存储Ceph
- 5.2.3 宽表存储HBase
- 5.2.4 文档搜索引擎Elasticsearch
- 5.3 分布式计算技术
- 5.3.1 MapReduce
- 5.3.2 Spark
- 5.3.3 Presto
- 5.4 分布式资源管理技术
- 5.5 分析型数据库
- 5.5.1 MPP数据库
- 5.5.2 分布式分析型数据库
- 5.5.3 分析型数据库的评价
- 5.6 数据联邦
- 5.7 湖仓一体架构
- 5.7.1 Hudi
- 5.7.2 Iceberg
- 5.7.3 Delta Lake
- 5.8 流批一体架构
- 5.8.1 Lambda架构
- 5.8.2 Kappa架构
- 5.8.3 Flink
- 5.9 存算分离架构
- 5.9.1 基于云存储的存算分离
- 5.9.2 基于本地存储的存算分离
- 5.10 中国联通集团的数据底座建设
- 5.10.1 大数据技术架构
- 5.10.2 数据平台架构
- 第6章 数据与AI的融合
- 6.1 推荐系统
- 6.1.1 协同过滤
- 6.1.2 内容过滤
- 6.1.3 基于向量的近邻召回的推荐系统
- 6.1.4 基于点击率预估模型的推荐系统
- 6.2 基于LLM的数据治理与分析
- 6.2.1 智能化数据治理
- 6.2.2 基于LLM的数据分析
- 6.3 数据标注
- 6.4 向量数据库
- 6.4.1 特征与向量
- 6.4.2 相似度的度量
- 6.4.3 向量检索的召回率与准确率
- 6.4.4 向量检索与索引技术
- 6.5 知识图谱
- 6.5.1 知识的表示方法
- 6.5.2 知识抽取与推理技术
- 6.5.3 知识存储与图模型
- 6.5.4 图数据库与图计算技术
- 6.6 AI数据安全的挑战与防护技术
- 6.6.1 对抗样本攻击与防御
- 6.6.2 数据投毒攻击与防御
- 6.6.3 后门攻击与防御
- 6.6.4 预训练大模型的数据风险
- 第7章 企业AI应用的方法论与知识融合
- 7.1 通用模型、推理模型与智能体
- 7.1.1 通用模型
- 7.1.2 推理模型
- 7.1.3 智能体
- 7.1.4 典型案例:DeepSeek大模型
- 7.2 企业AI应用落地方法论
- 7.2.1 企业AI应用落地条件
- 7.2.2 企业AI落地场景
- 7.2.3 企业AI场景实践案例
- 7.3 大模型与企业知识融合
- 7.3.1 大模型数据调优难题:Demo与上线的差距
- 7.3.2 LLM的知识机制
- 7.3.3 企业AI应用的基础设施只需要DeepSeek吗
- 7.4 知识工程中的大模型应用
- 7.4.1 大模型参数差异与NER任务的影响
- 7.4.2 知识增强对实体识别的优化
- 7.4.3 易混淆知识的识别策略
- 7.4.4 知识长度与识别准确率的关系
- 7.4.5 推理能力对大模型识别效果的影响
- 7.4.6 大模型驱动的知识工程流水线
- 第8章 数据领域技术趋势与思考
- 8.1 数据技术的自主可控
- 8.2 开源技术的发展与挑战
- 8.3 数据中台的发展历程与思考
- 8.4 数据编织技术的原理与展望
展开全部
出版方
人民邮电出版社
人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。