《干净的数据：数据清洗入门与实践》电子书在线阅读-【美】斯夸尔-得到APP

4.8

用户推荐指数

互联网类型

5.5 豆瓣评分

可以朗读语音朗读

175千字字数

2016-05-01 发行日期

展开全部

主编推荐语

掌握高效数据清洗方法，让用户更好地体验大数据价值。

内容简介

理解数据清洗在整个数据科学过程中的作用，掌握数据清洗的基础知识，包括文件清洗、数据类型、字符编码等。

发掘电子表格和文本编辑器中与数据组织和操作相关的重要功能，学会常见数据格式的相互转换，如JSON、CSV和一些特殊用途的格式，采用三种策略来解析和清洗HTML文件中的数据，揭开PDF文档的秘密，提取需要的数据。

借助一系列解决方案来清洗存放在关系型数据库里的坏数据，创建自己的干净数据集，为其打包、添加授权许可并与他人共享，使用书中的工具以及Twitter和Stack Overflow数据，完成两个真实的项目。

评分及书评

4.8

4个评分

Ahyena
2021-03-28

给这本书评了

4.0

去年以来一直在做政务软件的服务，会面对越来越庞大的数据，而行政事业单位有大量从手工业务中搬过来的数据，与软件的适配度极差，因而大大增加了工作人员的劳动强度和出错概率。虽说名义上在使用软件工具，但依然避免不了持续地加班，陷入到杂乱琐碎的数据纠错和分析当中，很难高效地加工信息，不胜其扰，侵蚀到了静好的生活。我个人也同样经历过在数字丛林中跋涉而疲惫不堪的过程，这次是以工作的名义来阅读这本书，然而，在我阅读这本书的时候依然是一个凭借 Excel 做数据清洗的新手，虽说技术普通，但当我将 “数字清洗” 这个概念引入工作以后，工作效率已然成倍地提升了，这真是一个可喜的进步！数字时代，信息汹涌，而有价值的信息往往混杂在浩瀚的冗余信息当中，导致我们就像是深潜在大海里的人，身边全是水，却没有一口可以喝。所以，今天如果没有 “数据清洗” 思维，我们就没法将数据作为原材料处理成信息、加工成知识、转化为智慧。书店里关于数字清洗的书并不多，这本书可以算是入门级，我推荐你一起阅读。
转发
转发同时评论

快速转发

评论

4

分享
「微信」扫码分享
Robust
2022-06-21

给这本书评了

5.0

本书正是为那些时常需要与数据打交道的人准备的，包括数据科学家、数据新闻记者、软件开发人员以及其他相关人士。无论你从事的是哪种职业，本书都会传授你一套快速而简便的实用策略，用来填补现有数据和期望数据之间的空白。
转发
转发同时评论

快速转发

评论

1

分享
「微信」扫码分享