评分及书评

4.2
59个评分
  • 用户头像
    给这本书评了
    4.0
    有人知道我们在撒谎

    🍀 会说谎的地球人还记得《三体》中有个重要设定,让地球人有机会在面对科技全面压制我们的三体人时尚存一丝胜机,那就是地球人 * 会说谎 *,而三体人不会。读到这里的时候,一种复杂的滋味在心底萌发,哭笑不得。🍀 Google 知道如果采用传统的方式对人性问题进行调查,由于受困于 “小数定律”,并不容易进行严谨的调研并给出经得起推敲的结论。好在,我们还有互联网,事实证明,当人们面对 Google 的时候更愿意说真话,本书的作者赛思・斯蒂芬斯–达维多维茨恰恰是一位互联网数据专家。作者使用 Google 趋势提供的功能,调研了包括种族主义、总统大选、NBA 球队的受欢迎程度等大量问题,其结果可以用让人震惊来描述。人们自己宣称的(公开媒体或行为)和心里的实际想法(Google 搜索关键词)存在大量不可忽视的矛盾。对此,唯一的解释就是有大量的人在说谎,他们公开发表的言论和他们内心实际的看法存在矛盾。🍀 Google 知道什么?前面一段写的轻松,实际上,通过互联网的公开信息来完成一次有价值的调研肯定不是一件容易的事,畅销书《黑天鹅》的作者纳西姆・塔勒布曾经说过 “我不是说大数据中没有信息,事实上它包含很多信息,但问题是,提取信息比大海捞针还难,而这也是主要问题。” 仅仅为此,也值得向作者致上敬意。在书中,作者通过缜密的分析,呈现了包括如下问题的科学观点:如何根据患者对于自身症状的搜索来判断其是否患有胰腺癌?抑郁症和地理位置的关系?大多数 NBA 球员都出身寒门吗?佛罗伊德的理论正确吗?赛马的能力取决于身高?体重?血统?还是左心室大小?……🍀 作者的思考当然,仅仅停留在对于热点问题的猎奇不足以成为一本好书,作者对于自己完成这本书所使用数据这件事本身的道德性提出质疑和思考,并且提出,大数据的革新将会带来一场革命,但这并不意味着我们可以用数据解决一切问题。大数据无法消除千年来人类探索出来的认识这个世界的所有方法,它们互为补足。🍀 真正的科学作者在结论中写到,社会科学正在成为一门真正的科学,而且这一新的、真正的科学将会改善我们的生活。对此,我表示相信并且充满期待。

      转发
      1
      用户头像
      给这本书评了
      4.0
      如同顯微鏡和望遠鏡徹底變革了自然科學的大數據

      某女在社交媒體上秀恩愛,若她同時在 Google 上打出一個問題 “我老公是不是……”,她最有可能搜的問題是什麼?一般情況下,大多數人在社交媒體上秀出的一面都是美化過的。當他們在搜索的時候常常會暴露自己真實的想法。所以大多數人很容易憑直覺猜測,她搜索的很可能是:“我老公是不是出軌了?” 但是這本書告訴我們,實際上她最有可能問的問題是: “我老公是不是同性戀?” 這個問題的搜索量比 “我老公是不是出軌了?” 的搜索量高出 10%。在本書裡類似挑戰我們直覺的例子比比皆是。當然這不是一本簡單的案例集,而是《經濟學人》2017 年七月推薦的美國最新出版的一本有關大資料的書。《經濟學人》的評論說, “這本書以搜索資料為嚮導,快速地領略了現代人的內心世界。” 書中挑戰了暢銷書作家格拉德威爾在他的暢銷書《眨眼之間》中提出的觀點。格拉德威爾認為,依賴直覺的判斷在很多情況下比深思熟慮要來的有效得多。不過,《人人都會說謊》這本書裡說,大多數人都會放大自我的感受,以個體的經驗來推測群體的想法,而恰恰在這種推導過程中,容易產生謬誤。大眾到底怎麼看待不同的問題,很難簡單通過自己的體驗來預測。相反,大數據給了我們瞭解更多人真實想法的最好的機會。大數據、人工智慧和自動化是當下最受關注的三大科技熱點。利用大數據分析來瞭解普通人的喜好、瞭解真實的世界到底怎麼運行,是科技推動認知發展的全新研究領域。大數據研究也正在顛覆許多人類常識的認知。隨著未來可以搜集的大數據越來越多,顆粒度越來越細,大數據可以揭示的真實世界會更多。就像《經濟學人》在《人人都會說謊》書評中說到的那樣:大數據將為社會科學帶來一場革命,就像顯微鏡和望遠鏡徹底變革了自然科學那樣。

        转发
        评论
        用户头像
        给这本书评了
        3.0
        我们真的有需要真实吗?

        本书作者通过分析大量的数据,为我们揭开了人们真实的意图和欲望。事实证明,人们借助互联网搜索各种信息的行为本身就是一种数据,一种真实反映了当下人们所思、所欲、所惧的一种信息。人们之所以(对朋友、对调查、对自己)说谎,是为了让自己看起来更好一些。其实这个世界也无时不刻的在通过向我们提供有偏差性的数据来误导我们,对我们说谎。通过巧妙地运用自然试验,我们可以发现什么是真正有用的,什么是无用的。这些试验证明了大数据的合理使用,能在许多方面替代传统的透过经验与智慧的猜测预估。当我们凭借亲身经历来判定这个世界的运作模式时,通常都会出错。虽然根据数据科学方法是具有直觉性的,但其结果多是反直觉的。数据科学采用既具本能性又具直觉性的人工流程并向其注入更多功能,这就让我们看到这个世界的运作方式可能会与我们之前的认知完全不同。

          1
          2
          用户头像
          给这本书评了
          4.0
          皇帝的新衣

          从前:看,那个人没穿衣服,好奇怪!现在:看,那个人竟然穿着 "衣服",他是怎么做到的?互联网时代,你我皆裸奔。大数据比你最亲密的人,甚至是你自己更了解你。操作数据的人,可能也变相的掌控着这个世界。

            转发
            评论
            用户头像
            给这本书评了
            3.0
            大数据不应该是逆向工程

            大数据不应该是逆向工程受到万维钢精英日课的启发我开始了这本书的学习,google trends 确实有很多数据,而且能够反应出很多。但我此刻的感受却是大数据不应该是逆向工程,先降维在升维这是一种不负责任的工作态度,我们作为软件开发,就应该提供数据分析者视角,大数据为什么那么 "难",在我看来很多时候就是维度缺失。统计学固然有假设检验,置信度处置的方案,但是这个事情很浪费时间。注意:我并不是说这个方案她个不重要,而是想告诉自己,这其实是一种生产关系的缺失对于一家公司来说 BI 和技术的关系,如果后者怎么简单怎么来(降维),一个老子天下第一因为是个 vip 服务(妄图升维),这是一种多恶心的关系。双向扯淡,最终的结果就是各种成本损耗。数据分析应该是个双向奔赴的过程。业务产技就是应该能说清楚目标是什么的人在一家公司,我们应该是给别人开视角,很多时候大家觉得要这么做,然后就上线一个 app,但事实上,如果没有衡量标准,那么就不要做,因为在不确定,他也要数据化,哪怕最终证明,你做的事情和结果(挣多少 "钱" 无关)那也能让别人知道。这是一种多么宝贵的东西。我们总说成功学是幸存者偏差,那么能不能此时此刻做一些来自『失败的积累』让大家不要犯错???数据是一门严肃的科学

              转发
              评论
              用户头像
              给这本书评了
              5.0
              感兴趣的书籍

              曾在 5 年前听过万维钢老师解读过本书,当时就下决心要好好读一读原书,今天读完了。感谢得到电子书。本书解读了为什么社会调研的结果,人们的直觉,甚至是许多人相信的常识,都不一定能反映真实的世界?因为人们在许多场合中会掩饰自己真实的想法,也会倾向依赖个人的经验来推测群体的想法。大数据,给了认识普罗大众真实想法的机会。大数据分析可以更好地帮助你洞察这个世界到底怎么运作。《人人都会说谎》的作者赛斯・斯蒂芬斯 - 大卫德维茨曾经担任谷歌大数据科学家,作者说自己在大学毕业时读了《魔鬼经济学》,发现运用好奇心、创造力和数据就能极大提升我们对这个世界的认知,就立志要从数据的海洋中找出现实世界到底如何运作的真相,离开谷歌之后,他在《纽约时报》专门撰写大数据相关的专栏,是大数据领域的资深专家。大数据到底能揭示怎样一个真实的世界,帮助我们找出常识中的谬误?本书告诉我们,如果我们都带着好奇心去打量我们所处的世界,大数据分析常常帮助我们得出一些反常识的答案。更重要的是,大数据分析可以让我们更好辨析大趋势,也可以为每个人提供 “私人定制” 的服务。本书的研究发现,世界充满了谎言,人类或出于善意或出于恶意,无时无刻不在说谎。对于很多问题,传统的统计调研方法得出的结论很多是错误的,误导了我们的认知。但是,人们往往在一个地方放下戒备、吐露心声,那就是互联网。每一次搜索、每一次点击、每一次停留、每一次关闭…… 在线生成了大量的数据,暴露着你的真实想法、欲望、恐惧和职业,而海量的数据形成的真实而庞大的数据宝库会总结出意想不到的结论和趋势。在这本应时的力作中,作者从一个个备受关注的话题切入,用他独特的数据分析方法得出了很多颠覆认知的结论。很多问题的答案正暗藏于看似没有关联的因素中,很多直觉和经验给出的答案与事实相差千里,大数据被合理使用其实比数据库的大更重要…… 作者广博的知识面将从多个层面拓展我们的认知边界;书中生动有趣的描写让你不想错过任何一个细节。利用大数据分析来了解普通人的喜好,了解真实的世界到底怎么运行,是科技推动认知发展的全新研究领域。大数据研究也正在颠覆许多人类常识的认知。随着未来可以搜集的大数据越来越多,颗粒度越来越细,大数据可以揭示的真实世界会更多。了解更真实的世界,是我们做出正确决策的第一步。

                转发
                评论
                用户头像
                给这本书评了
                3.0
                数据和真实之间的鸿沟#每天解读一本书

                一句话总结,是一本浅显入门级的数据分析书籍。


                本书作者利用网络搜索的关键词找到了一个 “全新”(相较于过去) 的调查统计的方法,不过这些知识如今已经是数据分析领域的标配了,而我认为他对于大数据的反思更有价值,更大的规模真的就能带来更精准的预测分析吗?以二重身为模式的分析推荐在多大程度上是有效的,又在多大程度上符合人们的隐私权。
                如果未来别人利用我们的公开信息推导出我们不愿表露的秘密,那么他们是否侵犯了我们的隐私呢?
                一、重新评价真实
                过去的社会学研究如果想要了解人群的特性,最常用的办法就是发放调查问卷,但问卷实际上面对两个非常容易被认识到,却难以评估的误差,一个是人们并不知道自己是否知道,另一个是人们不愿意让别人知道,这两个要素让传统的方法彻底失效,比如大部分人会否认或者只报告少量自己观看成人网站的次数,而人们又很容易多报每周性生活的数量,而我常常称这为社会学的测不准原理,在你没有调查前人们处在自己正常的状态,一旦面对调查他们就会坍缩到一个社会文化通常的位置上。
                而面对本就未知的人性,互联网给了我们一个重新评估的渠道,一个非常微弱,以至于不会影响人们当下的测量方法,最直观的就是搜索量,有多少人看成人网站,我们并不需要问这个问题,只要看看成人网站相关的关键词搜索量有多少,而男性中同性恋的比例是多少?看来观看成人网站的男性中有多少搜索同性内容就可以很好的模拟。
                二、人类的可预测性
                为了解释本书中预测的准确性,我想谈谈自己从别的书籍中得到的启发。
                对人性的认识经历了一个与物理学相类似的过程,从最初认为人性是神创的完美,到我们开始发现人性中不断反复固有模式的机械认识,最后到现在像云又像钟的概率认识。
                人脑以简单的连接驱动,形成丰富的智力涌现,在这背后本身是一个并不随机的概率系统,由此我们也得到了一个无法做到真随机的大脑,而任何不能随机的东西,其虽然有复杂系统造成的混乱,却总无法摆脱在某些方面上有的规律性。
                最简单的例子就是犯罪行为学中的最小努力原则,如果一个罪犯形成了稳定的作案模式,那么他就会倾向于通过他需要付出最少成本的方式行动,用到人身上,你更愿意去楼下小店吃饭,而不是天天做三站路出去,这个预测完全准确吗?肯定不是,但实际上我们也不需要完全准确,因为当预测的成本不断下降,我们只需要几次预测正确得来的收益就足以覆盖成本。
                三、关于数据的反思
                当我们都认为数据分析可以帮助我们看清一切的时候,作者提出了两个很深刻的反思,一个是数据规模真的是越大越好吗?另一个是分析的度究竟在哪?
                数据的价值本质上其实是信息的价值,对于没有透彻研究的领域,数据量的增加会伴随信息的增加,而新的信息自然会带来对原有模型的改进,可是当我们面对的是一个研究很透彻的领域时,规模的价值往往就失效了,甚至规模过大会造成过度拟合,造成错误的预测,这时更有价值的往往是独特的解读方式,甚至可能是一些新却少的东西,小数据反而才能告诉我们未来。
                而分析的度,这或许是我们未来永远要面对的问题,当分析的手段越来越丰富,我们原来自愿透露的信息往往也在透露我们自己是谁了,这时的隐私究竟是什么呢?我想肯定不是保守自己秘密的权力,如果这个秘密并不正当,那么又是否该被曝光呢?而谁来判断它是否正当?

                  转发
                  评论
                  用户头像
                  给这本书评了
                  3.0

                  一句话,不要相信直觉,要相信数据验证,特别是有了 google 之后

                    转发
                    评论
                    用户头像
                    给这本书评了
                    5.0

                    关于大数据的应用 最好的一本书

                      转发
                      评论
                      用户头像
                      给这本书评了
                      4.0
                      读《人人都在说谎:赤裸裸的数据真相》

                      本书是一本优秀的统计学科普读物,全书没有任何数据计算,和繁杂分析过程,只是向读者展示赤裸裸的数据真相,几乎所有这些真相都与我们的常识相悖。它试图向读者解释一件事 —— 人们总是言行不一。由于社会压力和个人道德律的影响,人们不会将他们的真实想法公之于众,代之以 “政治正确” 的表达。也正是因为上述原因,这本书并不是我心目中现阶段最需要的统计学类书籍,而且书中大量的例子都是美国社会的常识,对于一直生活在中国小城里的我来说,还是太过遥远。所以,评价 4 星。

                        转发
                        评论
                        用户头像
                        给这本书评了
                        4.0
                        人性是复杂的

                        本书给我最直接的感受就是:我们人类也太能装了吧!

                          转发
                          评论
                          用户头像
                          给这本书评了
                          4.0

                          世界充满了谎言,人类或出于善意或出于恶意,无时无刻不在说谎。对于以上以及类似的很多问题,传统的统计调研方法得出的结论很多是错误的,误导了我们的认知。但是,人们往往在一个地方放下戒备、吐露心声,那就是互联网。每一次搜索、每一次点击、每一次停留、每一次关闭…… 在线生成了大量的数据,暴露着你的真实想法、欲望、恐惧和职业,而海量的数据形成的真实而庞大的数据宝库会总结出意想不到的结论和趋势。

                            转发
                            评论
                            用户头像
                            给这本书评了
                            4.0

                            通过巧妙的数据科学研究展现了很多颠覆性的结论,特别是其中对数据的理解超乎想象。

                              转发
                              评论