展开全部

主编推荐语

39位业内最佳数据实践者揭秘如何为各种项目开发简单优雅的解决方案。

内容简介

本书让你发现,数据原来可以是如此的广泛和美丽,令人痴迷。

这部个人故事集合,让你可以站在优秀的数据设计师、管理者和处理者的肩上,去仔细审视涉及到数据的一些最有趣的项目。书中涉及的领域很广,各领域的精英们娓娓道来相关领域的数据信息系统的架构的设计,包括Yahoo!的云存储架构、Deep Web数据抓取、Facebook的信息平台、自然语言处理、“凤凰号”火星探测器的图像数据处理、探索数据生命的DNA漫谈,甚至是Radiohead视频的制作、旧金山的次贷危机等。

“在本书中,各业界领袖描述了他们的项目如何通过新的方式来驾驭数据的力量。对于任何对未来关于数据和问题解决感兴趣的读者来说,本书是必读的佳作。”——Tim O’Reilly

目录

  • 版权信息
  • O'Reilly Media,Inc.介绍
  • 译者序
  • 前言
  • 第1章 在数据中观察生活
  • 个人环境影响报告(PEIR)
  • your.flowingdata(YFD)
  • 个人数据收集
  • 数据存储
  • 数据处理
  • 数据可视化
  • 要点
  • 如何参与
  • 第2章 美丽的人们:设计数据收集方法时牢记用户
  • 简介:用户共鸣正当其时
  • 项目:关于一个新奢侈品的用户调查
  • 数据收集面临的特殊挑战
  • 设计解决方案
  • 结论和反思
  • 第3章 火星上的嵌入式图像数据处理
  • 摘要
  • 简介
  • 一些背景
  • 数据是否打包
  • 三个任务
  • 对图像切槽
  • 传递图像:三个任务间的通信
  • 获取图片:图像下载和处理
  • 图像压缩
  • “下行”或一切都从这里向下传输
  • 结束语
  • 第4章 PNUTShell中的云存储设计
  • 简介
  • 更新数据
  • 复杂查询
  • 和其他系统的比较
  • 结论
  • 致谢
  • 参考文献
  • 第5章 信息平台和数据科学家的兴起
  • 图书馆和大脑
  • Facebook具有了“自知之明”
  • 商业智能系统
  • 数据仓库的消亡和重起
  • 超越数据仓库
  • “猎豹”和“大象”
  • 不合理的数据有效性
  • 新工具和应用研究
  • MAD技术和Cosmos
  • 作为数据空间的信息平台
  • 数据科学家
  • 结论
  • 第6章 照片档案的地理之美
  • 数据之美:Geograph项目
  • 可视化、美丽和树形图
  • Geograph在使用条款上的观点
  • 发现之美
  • 反思和结论
  • 致谢
  • 参考文献
  • 第7章 数据发现数据
  • 简介
  • 实时发现的好处
  • 赌桌上的舞弊
  • 企业的可发现性
  • 目录:无价之宝
  • 相关性:什么是重要的以及对谁重要
  • 各个组件及特殊考虑
  • 隐私考虑
  • 结束语
  • 第8章 实时的可移动数据
  • 简介
  • 前沿技术
  • 社交数据规范化
  • 结束语:通过Gnip思考
  • 第9章 探寻Deep Web
  • 什么是Deep Web
  • 提供Deep Web访问的其他可选方案
  • 结论
  • 参考文献
  • 第10章 构建Radiohead的"House of Cards"
  • 这一切是如何开始的
  • 数据捕捉设备
  • 两种数据捕捉系统的优点
  • 数据
  • 捕捉数据,即“拍摄”
  • 处理数据
  • 后期数据处理
  • 发布视频
  • 结束语
  • 第11章 都市数据可视化
  • 引言
  • 背景
  • 解决棘手问题
  • 公开数据
  • 重新回顾
  • 结束语
  • 第12章 Sense.us的设计
  • 可视化和社会数据分析
  • 数据
  • 可视化
  • 协作
  • “向导”和“偷窥”
  • 结论
  • 参考文献
  • 第13章 数据所做不到的
  • 何时数据无法驱动
  • 结束语
  • 参考文献
  • 第14章 自然语言语料库数据
  • 分词
  • 密码
  • 拼写纠正
  • 其他任务
  • 讨论和结论
  • 致谢
  • 第15章 数据中的生命:DNA漫谈
  • 用DNA存储数据
  • DNA作为数据源
  • 搏击数据洪流
  • DNA的未来
  • 致谢
  • 第16章 美化真实世界中的数据
  • 关于真实数据的问题
  • 提供可以追溯到记录本的原始数据
  • 验证开放来源数据
  • 在线发布数据
  • 结束循环:采用可视化技术启发新实验
  • 在开放数据和免费服务下建立数据网络
  • 致谢
  • 参考文献
  • 第17章 数据浅析:探索形形色色的社会定型
  • 引言
  • 预处理数据
  • 探索数据
  • 年龄、魅力和性别
  • 观察标签
  • 哪些单词具有性别化
  • 聚类
  • 结论
  • 致谢
  • 参考文献
  • 第18章 旧金山海湾区之殇:次贷危机的影响
  • 引言
  • 我们是如何获取数据的
  • 地理编码
  • 数据检查
  • 分析
  • 通货膨胀的影响
  • 富者更富,穷者更穷
  • 地理区别
  • 人口普查信息
  • 探索旧金山
  • 结论
  • 参考文献
  • 第19章 美丽的政治数据
  • 实例1:重新划分选区和党派偏好
  • 实例2:估计的时间序列
  • 实例3:年龄和选举
  • 实例4:关于最高法院被提名人的公众舆论和参议院选票
  • 实例5:宾夕法尼亚州的本地党派
  • 结论
  • 参考文献
  • 第20章 连接数据
  • 实际上到底存在哪些公共数据
  • 连接数据的可能性
  • 企业内部
  • 连接数据的障碍
  • 可能的解决方案
  • 集体调解
  • 结论
  • 附录 作者简介
  • 附录 彩图
展开全部

评分及书评

尚无评分
目前还没人评分

出版方

机械工业出版社有限公司

机械工业出版社是全国优秀出版社,自1952年成立以来,坚持为科技、为教育服务,以向行业、向学校提供优质、权威的精神产品为宗旨,以“服务社会和人民群众需求,传播社会主义先进文化”为己任,产业结构不断完善,已由传统的图书出版向着图书、期刊、电子出版物、音像制品、电子商务一体化延伸,现已发展为多领域、多学科的大型综合性出版社,涉及机械、电工电子、汽车、计算机、经济管理、建筑、ELT、科普以及教材、教辅等领域。