展开全部

主编推荐语

一本书掌握数据资产管理、数据底座技术、AI安全与大模型应用选型。

内容简介

本书旨在帮助数据行业的从业者在AI时代提升数据管理和数据技术认知水平,内容覆盖数据价值创造的理论、技术和实践。

本书共8章。第1章回顾企业数据的发展历史,并讲解现代企业数据组织。第2章从多维度解析数据价值的创造路径,包括从构建数字化决策、加速业务创新和推动AI变革等视角介绍数据价值创造的方法和成果。

第3章系统讲解数据管理的方法与技术,包括数据资产管理、数据资产运营、数据平台架构的规划及实践案例。第4章讲解数据要素价值化的路径探索,包括数据要素在多行业的应用、基础体系、可信数据流通技术及数据资产入表。

第5章讲解数据底座的技术与实践,包括数据底座的架构要求、分布式存储技术、分布式计算技术等,以及多种架构介绍。第6章讲解数据与AI的融合,包括推荐系统、基于LLM的数据治理分析、数据标注等。

第7章介绍企业AI应用的方法论与知识融合。第8章是数据领域技术趋势与思考,包括数据技术的自主可控、开源技术的发展与挑战、数据中台的发展历程与思考、数据编织技术的原理与展望。

目录

  • 版权信息
  • 内容提要
  • 作者介绍
  • 推荐序
  • 前言
  • 第1章 数字化与信息化
  • 1.1 数据与信息
  • 1.2 数据处理的起源
  • 1.3 数字化的数据处理
  • 1.3.1 从机械化到数字化
  • 1.3.2 从数据处理到信息系统
  • 1.3.3 面向记录事务的数据管理
  • 1.4 数据管理与分析
  • 1.5 商业智能与数据科学
  • 1.6 数据可视化
  • 1.7 现代企业数据组织
  • 1.7.1 数据工程师
  • 1.7.2 数据分析师
  • 1.7.3 数据科学家
  • 1.7.4 数据管理人员
  • 第2章 数据价值的创造路径
  • 2.1 数据分析创造价值
  • 2.1.1 企业数据价值创造的阶段化路径
  • 2.1.2 国内数字化的行业观察
  • 2.2 数据价值:数字化决策
  • 2.2.1 运营管理的数字化
  • 2.2.2 风险管理的数字化
  • 2.2.3 营销获客的数字化
  • 2.3 数据价值:业务创新
  • 2.3.1 线下业务转线上
  • 2.3.2 监管的数字化
  • 2.4 数据价值:推动AI变革
  • 2.4.1 ImageNet
  • 2.4.2 数字疗法
  • 2.5 数据价值创造的组织保障
  • 2.5.1 数据管理团队能力建设
  • 2.5.2 数据产品团队能力建设
  • 2.5.3 数据底座团队能力建设
  • 第3章 数据管理的方法与技术
  • 3.1 数据资产管理
  • 3.1.1 数据模型管理
  • 3.1.2 数据标准管理
  • 3.1.3 数据质量管理
  • 3.1.4 主数据管理
  • 3.1.5 元数据管理
  • 3.1.6 数据安全管理
  • 3.1.7 数据资产管理平台
  • 3.2 数据资产运营
  • 3.2.1 数据可视化
  • 3.2.2 商业智能
  • 3.2.3 数据洞察
  • 3.2.4 数据标签
  • 3.2.5 数据指标
  • 3.2.6 数据资产盘点与编目
  • 3.2.7 数据资产运营平台
  • 3.3 数据平台架构
  • 3.3.1 数据仓库
  • 3.3.2 数据湖
  • 3.3.3 数据集市
  • 3.3.4 数据中台
  • 3.4 中国联通的数据运营体系
  • 3.4.1 数据运营体系的建设由来
  • 3.4.2 数据运营的规范统一
  • 3.4.3 统一工具支撑“一体化运营”
  • 3.4.4 “一套数据管理体系”保障数据供给
  • 第4章 数据要素价值化的路径探索
  • 4.1 数据要素:数据价值的产业化
  • 4.1.1 数据要素×医疗健康
  • 4.1.2 数据要素×金融服务
  • 4.1.3 数据要素×智慧农业
  • 4.1.4 数据要素×气象服务
  • 4.2 数据要素的基础体系
  • 4.2.1 数据基础设施
  • 4.2.2 数据基础制度
  • 4.3 可信数据流通技术
  • 4.3.1 数据空间
  • 4.3.2 其他技术路径
  • 4.4 数据资产入表
  • 4.4.1 数据资产的确认
  • 4.4.2 数据资产的会计计量
  • 4.4.3 数据资源入表管理平台
  • 第5章 数据底座的技术与实践
  • 5.1 数据底座的架构要求
  • 5.1.1 数据底座的能力要求
  • 5.1.2 数据底座的核心功能
  • 5.2 分布式存储技术
  • 5.2.1 分布式文件存储HDFS
  • 5.2.2 对象存储Ceph
  • 5.2.3 宽表存储HBase
  • 5.2.4 文档搜索引擎Elasticsearch
  • 5.3 分布式计算技术
  • 5.3.1 MapReduce
  • 5.3.2 Spark
  • 5.3.3 Presto
  • 5.4 分布式资源管理技术
  • 5.5 分析型数据库
  • 5.5.1 MPP数据库
  • 5.5.2 分布式分析型数据库
  • 5.5.3 分析型数据库的评价
  • 5.6 数据联邦
  • 5.7 湖仓一体架构
  • 5.7.1 Hudi
  • 5.7.2 Iceberg
  • 5.7.3 Delta Lake
  • 5.8 流批一体架构
  • 5.8.1 Lambda架构
  • 5.8.2 Kappa架构
  • 5.8.3 Flink
  • 5.9 存算分离架构
  • 5.9.1 基于云存储的存算分离
  • 5.9.2 基于本地存储的存算分离
  • 5.10 中国联通集团的数据底座建设
  • 5.10.1 大数据技术架构
  • 5.10.2 数据平台架构
  • 第6章 数据与AI的融合
  • 6.1 推荐系统
  • 6.1.1 协同过滤
  • 6.1.2 内容过滤
  • 6.1.3 基于向量的近邻召回的推荐系统
  • 6.1.4 基于点击率预估模型的推荐系统
  • 6.2 基于LLM的数据治理与分析
  • 6.2.1 智能化数据治理
  • 6.2.2 基于LLM的数据分析
  • 6.3 数据标注
  • 6.4 向量数据库
  • 6.4.1 特征与向量
  • 6.4.2 相似度的度量
  • 6.4.3 向量检索的召回率与准确率
  • 6.4.4 向量检索与索引技术
  • 6.5 知识图谱
  • 6.5.1 知识的表示方法
  • 6.5.2 知识抽取与推理技术
  • 6.5.3 知识存储与图模型
  • 6.5.4 图数据库与图计算技术
  • 6.6 AI数据安全的挑战与防护技术
  • 6.6.1 对抗样本攻击与防御
  • 6.6.2 数据投毒攻击与防御
  • 6.6.3 后门攻击与防御
  • 6.6.4 预训练大模型的数据风险
  • 第7章 企业AI应用的方法论与知识融合
  • 7.1 通用模型、推理模型与智能体
  • 7.1.1 通用模型
  • 7.1.2 推理模型
  • 7.1.3 智能体
  • 7.1.4 典型案例:DeepSeek大模型
  • 7.2 企业AI应用落地方法论
  • 7.2.1 企业AI应用落地条件
  • 7.2.2 企业AI落地场景
  • 7.2.3 企业AI场景实践案例
  • 7.3 大模型与企业知识融合
  • 7.3.1 大模型数据调优难题:Demo与上线的差距
  • 7.3.2 LLM的知识机制
  • 7.3.3 企业AI应用的基础设施只需要DeepSeek吗
  • 7.4 知识工程中的大模型应用
  • 7.4.1 大模型参数差异与NER任务的影响
  • 7.4.2 知识增强对实体识别的优化
  • 7.4.3 易混淆知识的识别策略
  • 7.4.4 知识长度与识别准确率的关系
  • 7.4.5 推理能力对大模型识别效果的影响
  • 7.4.6 大模型驱动的知识工程流水线
  • 第8章 数据领域技术趋势与思考
  • 8.1 数据技术的自主可控
  • 8.2 开源技术的发展与挑战
  • 8.3 数据中台的发展历程与思考
  • 8.4 数据编织技术的原理与展望
展开全部

评分及书评

评分不足
1个评分

出版方

人民邮电出版社

人民邮电出版社是工业和信息化部主管的大型专业出版社,成立于1953年10月1日。人民邮电出版社坚持“立足信息产业、面向现代社会、传播科学知识、服务科教兴国”,致力于通信、计算机、电子技术、教材、少儿、经管、摄影、集邮、旅游、心理学等领域的专业图书出版。