文章吧-经典好文章在线阅读:统计数据会说谎读后感10篇

当前的位置:文章吧 > 经典文章 > 读后感 >

统计数据会说谎读后感10篇

2018-07-01 04:04:02 来源:文章吧 阅读:载入中…

统计数据会说谎读后感10篇

  《统计数据会说谎》是一本由达莱尔•哈夫著作,中信出版集团股份有限公司出版的平装图书,本书定价:CNY 39.00,页数:176,特精心网络整理的一些读者读后感希望大家能有帮助

  《统计数据会说谎》读后感(一):【笔记】如何找到数据统计的坑

  作者整本书其实就是想教我们如何正确看待统计数据。书的最后告诉我们通过问5个简单问题即可以找(he)到(li)数(fan)据(bo)统(tong)计(ji)的(shu)坑(ju),总结如下

  1 是谁这么说(数据及衡量数据的标准方法是否有问题)

  1)选择的数据是否有倾向性,比如选择对自己有利的数据

  2)衡量的标准是否偏颇,比如对比前先用某一年作为基期,而后又选择对自己更有利的一年为基期;

  3)使用恰当的测算方式,比如选择一个对自己有利的平均

  2 他怎么知道(样本是否有问题)

  1)样本是否有偏差

  2)样本规模是否足够庞大,以确保结论真实可信(尤其是对待相关性

  3 漏掉了什么(漏掉了什么必要信息

  1)可信测算方式。一个相关若缺乏可信测算方式(如概率误差、标准误差)检验,则没必要当真

  2)未加说明的平均数。未说明是平均数是哪一个:算数平均数、中位数、众数。

  3)对比。许多数据因缺乏对比而变得无意义

  4)原始数据。材料只给出百分数,没有原始数据,通常带有欺骗

  5)导致变化发生因素。这种遗漏往往暗示其他因素才是导致变化发生的原因

  4 有人偷换了概念吗(原始数据和最终结论有没有什么地方被偷换概念)

  1)将一件事说成是另一件事。比如调查数据来自用户口述,这就这是他们说的,而非实际真实统计

  2)定义的概念发生变化。比如普查的农村数量增加,实际上是统计的农场概念变化导致的

  3)将相关关系说成因果关系。比如工厂电力工人小时工资不断攀升,没有因果关系

  4)“第一”的问题。不特别说明涉及的领域,每人都可以说自己是业界第一

  5 这是否合乎情理(是否以未经证实的假设基础

  1)是否以一些未经证实的公式来作为计算方法

  2)是否以一些未经证实的事实作为基础

  3)一些看似精确的数据也可能常识相悖

  4)慎重看待预测趋势。不加限制的外推法很荒谬,截至目前趋势或许是事实,但未来趋势不过是预测者猜测,所有事情并不会一成不变

  《统计数据会说谎》读后感(二):远离数据陷阱了解真实的世界

  “大数据”是个热词。通过网络搜索“大数据”,我们会发现大数据可以实现精准推送,治愈癌症,甚至可以预测未来。大数据似乎无所不能,还与AI黑科技息息相关,但一些关于大数据的推送提出了另一种看法——大数据可能并不那么万能,或许还会“说谎”。而我们常常看到的那些根据统计学基本原理计算得出的统计数据,也有可能会“说谎”,存在着数据陷阱。

  早在上个世纪50年代,美国统计专家达莱尔·哈夫就提出,人们所看到的未必是真实的情况,这些数据要么被过于夸大,要么被隐瞒。因此,只有识破并远离数据陷阱,才有可能从统计数据中了解真实的世界,避免被华而不实的数据“欺骗”。

  在《统计数据会说谎》这本书中,达莱尔·哈夫列举了很多与人们生活有关的统计数据——除了虚假广告数据,我们也可能被智力测验的结果所忽悠,并通过这些统计数据,讲述了统计学的基本原理,指出隐藏在统计数据中的“陷阱”。 这些数据中的“陷阱”,可能是带有偏差的样本,可能是经过精挑细选的平均数或者一条趋势线,也可能是视觉效果惊人的图表和形象图,就连地图也可能会“骗人”,简直是防不胜防

  那么,如何才能远离这些数据陷阱呢?达莱尔·哈夫建议我们提出5个问题:

  第一,是谁这么说?

  提出并思考这个问题可以帮助我们找到偏差,留心文中的描述

  第二,他怎么知道?

  第三,漏掉了什么?

  除了描述,我们更需要留心的是数据本身。统计数据中的均值和中位数有着本质上的区别,是否给出原始数据也很重要

  第四,有人偷换了概念吗?

  就算给出了原始数据,最终的结论也有可能被偷换概念,统计数据的“陷阱”防不胜防,多思考总是没错的;

  第五,这是否合乎情理?

  这个问题可以帮助我们看清统计数据是否建立在未经假设的基础上,从而避免被外推法的荒谬所误导。

  阿蒂莫斯·沃德说,让我们陷入困境的并非我们不知道的东西,而是我们知道但并不正确的东西。达莱尔·哈夫总结的远离数据陷阱的方法或许不能帮助我们避免陷入困境,但通过这些方法,我们可以思考统计数据中可能会误导我们的“陷阱”,从数据中,了解一个真实的世界。

  《统计数据会说谎》读后感(三):统计分析也可以很实用

  许多人觉得统计数据就是存在于新闻里的抽象派。

  统计数据?

  不就是每隔几年的人口普查?

  是每年的GDP增幅?CPI指数

  好像都跟我没什么关系……

  但是说到各地的平均工资水平最低收入、纳税基数,很多隐性贫困人口就感到丧丧的:原来那些良好的自我感觉都是假象,我的收入拖了后腿还不到当地的平均水平???

  那我们暂且先不讨论收入这种伤人的话题,就说说常见朋友圈爆款吧。

  前段时间有关星巴克致癌的文章刷爆了朋友圈,文章咖啡里的丙烯酰胺会诱发不可逆的基因损伤,60公斤成人每天摄取60毫克丙烯酰胺,患癌风险就将高出500倍。

  但是,文章并未就一杯中杯星巴克含有的丙烯酰胺含量进行说明,也并未说明丙烯酰胺产生的原因以及是否在其他食品中也有存在。也缺乏对比含有同样丙烯酰胺跨食品的对比。

  这就是文章的漏洞——看似科学的数据深究下来则是不攻自破谣言

  原来统计数据也会说谎???

  这么一来,下次再买买买之前要擦亮眼睛了:那些号称具有N年“科学临床数据”的产品说不定也是骗人的陷阱呢。

  美国统计学家达莱尔•哈夫在他的传世之作《统计数据会说谎》中就帮助我们看清那些宣传中滥用统计数据的陷阱,这部作品也曾被逻辑思维推荐

统计数据会说谎8.1达莱尔•哈夫 / 2017 / 中信出版集团股份有限公司

  下面,让我们来看一看达莱尔•哈夫借给了我们一双怎样的慧眼来洞悉那些推销员、广告商们营造的数据迷雾的。在《统计数据会说谎》中,达莱尔·哈夫从10个方面明了统计数据的陷阱和如何反驳看似科学的统计数据。接下来,我重点从样本偏差、有选择的平均数、极端数据三个方面来解释统计数据是如何说谎的。

  1、 样本偏差

  统计的基础就是如何选择样本进行调查,抽取的样本数量足够大并且分布合理的话选取的样本是能够代表整体水平的。而在选择样本时会因为调查者、样本等多方面因素造成统计出现偏差。

  回忆一下大学时你参加的街头拦截调查,你是不是会选择那些看起来年轻好说话、以学生为主的群体回答问题。这种情况就是因为调查者有意无意的选择而使抽样年轻化。而且,在参加诸如“你的年收入”是多少的时候,一般人都会虚报自己的收入让自己感觉好一点,而在年度纳税时,则会因为“合理避税”而让自己的收入最小化。

  2、 有选择的平均数

  算数平均数、中位数和众数都是一种有代表性的平均数。之所以会产生陷阱是因为根据不同的样本选择了没有代表性的平均数。

  比方说常常被我们吐槽的平均收入。

  大家都听说过二八法则,百分之二十的人占有百分之八十的收入。所以,针对某一群体的收入并没有遵循正态分布,而是一种偏态分布,差不多长下面这样,只不过峰值应该出现在末端。

  由于高收入人群会拉高整体的算数平均数,所以针对某群体的收入,采用集中频率较高的众数,或者针对收入由高到低降序排列选择位于中间水平的中位数,可能更有代表性。

  3、 极端数据

  就是没有透露的小数据。这些没有透露的小数有的是因为样本量很小,有个是隐瞒了在何种水平下数据的差异有意义的。

  说到小样本,在一些广告中展示的临床试验中就很常见。两个贝壳一个涂抹了某牙膏产品,一个未涂抹某牙膏产品,浸没在酸性环境下,涂抹某产品的贝壳更坚固。但是,仅仅这两个对比样本就能说明产品的功效吗?贝壳真的能够代表牙齿吗?

  显著性水平,听起来很玄乎,其实就是出现误差的概率。用一个成语来解释显著性水平就很容易理解十拿九稳,就是出现误差的概率是0.1。因为心理统计挂科过一次,现在想起统计学还是瑟瑟发抖……但回想起来统计学知识真的很有用啊,起码看到某些一本正经胡说八道看起来差异很大表明效果很好的“科学数据”,心中还是能够非常冷静地抱之以呵呵的。

  统计学毕竟还是一门博大精深学科想想曾经学过的概率论与数理统计、快要挂掉的高数和线性代数,再不济回顾一下中学时的课程或者是你的高考试卷。是不是没有想到统计学的应用是这么的广泛,比起你没有从事的本专业课程应用得更广泛了。

  除此之外,统计学还是一种统计分析的批判思维。这也是丹尼斯·韦特利在《成功心理学》中强调的想要成功的心理学要素之一。达莱尔•哈夫也在《统计数据会说谎》中强调了统计分析能力和读写能力一样,是一种了解真实世界的必备技能。在数字时代,面临海量数据,如何从中筛选出真实、有效的信息,化为己用,而不是人云亦云不假思索地拿来就用,这本《统计数据会说谎》会教会你很多。

  《统计数据会说谎》读后感(四):小心!有陷阱

  曾经的英国首相迪斯雷利有一句名言:“世界上有三种谎言:谎言、弥天大谎和统计数据。”美国统计专家达莱尔则在经典之作《统计数据会说谎》一书中,诠释了这句话的内涵。虽然此书于上世纪五十年代写就,但今天读来全无过时之感。古往今来,我们一直在被数据哄骗,又如法炮制数据相互伤害,唯一不同的是,“撒谎”的媒介报刊杂志走向公众号

  达莱尔用幽默的例证向我们证明:我们以为童叟无欺公正的数据,其实极有可能被“统计操纵”,成为某种精准的假象,并且,那种小数点后的数字尾巴、百分数、累加等都是再通俗不过的伎俩罢了。举个书中的小例子,作者自嘲:“这本书凝聚了长达187年的出版经验”,听上去无比厉害,究其本质,其实是作者、编辑插图作者、印刷工、装订工年龄相加所得。只呈现具有迷惑性的数据统计结果,却英雄不问出处,不讲数据来源,最终把读者搅得一惊一乍。

  《统计数据会说谎》一书中,大致归总了如下八种数据骗子行径

  第一,“随机”抽取小样本。

  第二,平均数、中位数、众数,哪个顺眼用哪个。

  第三,用文字游戏掩盖小规模样本。

  第四,概率误差。

  第五,改变坐标轴,数据图看起来大不同。

  第六,采取图像几何级增大,障眼法再升级

  第七,“相关”数据其实不相干。

  第八,不合时宜的逻辑归因,这是一种相对复杂高级骗法,需要想象力加大忽悠。除了书中所举的例子,还有一个经典社会学例证可以作为典型:根据统计数据,在斑马线上发生的人车相撞事件远多于道路其他地点,所以,走斑马线更容易发生车祸。这一荒谬的结论却有统计数据撑腰,其实只是简单玩了概率与归因谬误的小伎俩。真实的情况是:走斑马线的行人总数远远大于乱穿马路的行人,发生事故绝对值虽然略大,但概率的确远低。

  对于不那么容易用常识识破的数据陷阱,应当如何防范,书中亦比较良心地给出了建议,面对数据,多问问如下几个问题:

  第一, 数据的背后是谁在说,数据发布机构是否可靠

  第二, 他为什么知道这个数据,想想样本,想想数据的取得是不是靠谱

  第三, 统计还漏了什么?

  第四, 有没有偷换概念,数据和结论是不是真的有关?

  第五, 合理性,有常识用常识,没常识还可以问问知乎。

  当然,即使懂得很多道理,也未必就能成就火眼金睛。数据的陷阱,理论工具实践才是王道,终究还是被骗几次才能慢慢参悟罢。

评价:

[匿名评论]登录注册

评论加载中……