文章吧-经典好文章在线阅读:《数据统治世界》的读后感10篇

当前的位置:文章吧 > 经典文章 > 读后感 >

《数据统治世界》的读后感10篇

2018-07-28 04:39:02 来源:文章吧 阅读:载入中…

《数据统治世界》的读后感10篇

  《数据统治世界》是一本由[美]冯启思(Kaiser Fung)著作,Numbers Rule Your World: The Hidden Influence of P出版的平装图书,本书定价:49.80,页数:248,特精心网络整理的一些读者读后感希望大家能有帮助

  《数据统治世界》读后感(一):数据统治世界

  从图书馆突然看到了一些数据方面书籍,一方面这本书同过了几组案例进行对比,来描述了数据统计在我们生活中的一些作用,还有一些经典思想,另一方面就是让我们培养像统计学家一样的去思考转换我们看问题角度。虽说这个思想是很重要的,但仅仅凭借一本书是没办法去做到的。而且这本书由于被打扰看的周期比较长,有些故事观点没有连续,总体感觉有点一般。没有《大数据时代》等一系列的书长知识

  首先,异常和平均值,这个来自迪士尼排队和通过匝道来解决拥堵提高运行效率,这里将通过异常值,某一时段值很高,平时情况资源都是满足的,这个时候关注平均值就没有意义,所以异常值要比平均值更有意义。通过疾病信用评分来讲解相关性因果关系更重要,这个跟《大数据时代》中观点一致,我们知道有关系之后已经就可以采取情动了,耗费资源去探究其因果关系有时候往往就没那么重要了。通过黑人白人开始飓风保险业务讲述分析一些有类别差异的情况的时候应该尽可能根据特点进行分层和分组,这样的分析会更客观,更对我们有益药物和反恐都在讲预测的观点,因为预测都是有准确率,所以分几种情况

  坏人被预测成坏人,真阳性

  坏人被预测称好人,假阴性

  好人被预测成坏人,假阳性

  好人被预测成好人,真阴性,

  这里真阳性和真阴性都是没问提的,但是面对假性就要过多考虑,子啊比赛中坏人预测成好人会违反比赛的公平性,好人预测成坏人则会毁了运动员的一声,这个要比假阴性严重的多,而在恐怖分子筛选中,假阴性往往更重要,即使漏网一个那也是极度危险的,所以面对不同的情况要有不同的评判标准,这个很重要。最后一个,统计学家为何要自曝与死亡风险之中而置身于发财大梦之外呢,因为统计学家知道坐飞机失事和买彩票都是极小概率时间发生概率几乎为零,所以不需要担惊受怕和想一夜暴富。

  《数据统治世界》读后感(二):数据正在影响你的工作生活

  虽然我们现在热议大数据时代,开始到处谈论“大数据”。但其实,在我们的生活中,数据无处不在,当我们买彩票时,彩票的中奖概率组成了数据,当听到飞机失事时,我们又会看到相关的统计数据,更不用说经常听到的国民统计数据,还有一些以据调查显示开头的新闻了,甚至还会有关于“人们是否相信统计数据”的调查数据。由此,你是否想起了最近听到的统计数据呢?

  我们先以你我最熟悉的彩票故事为例,人们买彩票时,是否有想过自己大奖的概率?理论上说,每次彩票抽奖都是随机抽取的,与上次的结果和上上次的结果毫无关系,但还是有不少人在拿着以往的数据在预测未来期待自己能成为下一个幸运儿。但不幸的是,实现这样的梦想总归也没有几人,让我们再来看一下乘飞机出行,每当我们看到飞机失事的时候,总是想飞机太不安全了,当下次有机会在飞机和地面交通选择的时候,都义无反顾地选择了地面交通。这样做对吗?这个时候,统计科学家出现了,他们明确地告诉我们,飞机失事的概率和买彩票中的概率差不多。人们都在妄想买彩票中大奖,获得巨额财富,而又惧怕坐飞机,怕自己成为受害者,但两者的概率并无太大不同。事实上,这正是小概率的力量,在《数据统治世界》中,作者冯启思用这样一个故事为我们讲述一项统计式思维,“小概率的事件的发生性几乎为0”。

  其实,作者在讲述买彩票的例子的时候,是用这样一个故事来引出的,在加拿大,因为一桩彩票店店员将一名老人的中奖彩票据为己有的案例,让应用统计学家发现,彩票店店员的中奖概率要高出普通人的4倍!这不科学,因为发生这样的事情的概率只有10的十六次幂分之一(已经非常非常小的一个数字)。

  你应该明白了,在这个问题上,两名专家分别就彩票店中奖概率和飞机失事概率进行了研究,他们使用到的统计学思维便是“小概率事件不会发生”。因此,对他们来说,彩票对他们毫无吸引力,而且也十分信任自己乘坐的飞机。

  在《数据统治世界》一书中,包括“小概率事件不会发生”,作者总共介绍了5条统计式思维:“留意事件中的变异性”“从事实中发现有用信息”“同类进行比较”“两种错误之间的此消彼长”“小概率事件不会发生”。而他们又分别对应了十则精彩动人的故事,迪士尼的等候队列与明尼苏达州高速公路匝道,美国大肠杆菌流感与信用分评分,SAT考试测试与佛罗里达州的飓风保险,兴奋检测与测谎仪,异常的彩票中奖率与十分巧合的飞机失事事故。

  这十则精彩的故事,在每章中通过交叉叙述,事件发展跌宕起伏,作者带领着读者一步步探寻事情的真相,初次读来,本以为事情应该就此打住时,作者却又从新的线索或角度,将我们拉到另外一条精彩的故事线上,由此产生极好的脑力激荡。

  当你读完本书后,你在面对数据时,就可以通过新的角度,利用这些统计式思维重新审视我们身边发生的故事,和那些浮现在表面的数据,来揭示隐藏在数字背后的奥秘和数据的神秘力量。

  《数据统治世界》读后感(三):花一天时间读完之后的读书总结

  标题名字有点哗众取宠,不过书当然是好书。是很好的统计学思维入门书。

  第一章:强调某些事物特征类似木桶原理:运行效率取决于所有发生的因素中的最小值,而不是其均值。探明事物发生的性质本身,找到其实在依赖关系,而不要仅仅把思维局限于改变均值,关注变异,更能够解决问题。想到武汉的交通堵车,有些人认为不是因为车多,而是因为有些不守规矩行为导致行车速度变化大,拖累后面所有行车人员,从而总行车时间增加。如果控制开车行为,减少使车速降至极低事件的发生概率,车多造成的拥堵问题没那么大。

  第二章:相关关系和因果关系在运用上不同。有些重大的事件影响深远,必须严密地探察出其原因才能在解决问题的同时带来的伤害最小。而另外一些事件,原因众多纷纭,找到真实原因即使可能用处也不是那么大,在此时找到相关关系足够运用于实际决策,那么相关分析不需要真正探明因果关系。真正的因果可能会在逐渐寻找相关中显现出来。

  第三章:相互比较得出结论需要其他条件一致,这是一种基本的科学方法。在统计中做决策也是如此,不能把苹果橘子进行比较。因此需要比较不同的组之间的差别。只有在组间其它因素都相同时才能说明想要的结论。这也是计量经济学中控制变量和匹配想法了。分组不当会引起所谓的道德风险问题,无端招致更多的风险使总体缺乏效率,同时也有风险低的补贴风险高的不公现象

  第四章:弃真和取伪是一个跷跷板的关系,不改变估计方法或者样本容量,是无法同时减少二者的。这个在计量经济学中的运用是在做检验的时候,会有一个原假设和一个备择假设。以谁为原假设会对其有保护作用,而对备择假设比较挑剔,除非有很强的证据证明,否则不予接收。而做计量回归中,我们希望得到原假设不成立,以接受备择假设的意思是,我们希望接受的备择假设是在有充分证据的基础之上,因此是(从可得到的数据来说是)可靠的。在实际生活运用中,保护哪个,苛责哪个,取决于各自的收益成本对比。如同食品药品监督局所承担的风险一样,冤枉了一个好的固然不好,可是没什么大问题,放过了一个坏的,可就备受批评了。因此原假设就是东西是坏的也就可以理解了。同时也可以说明,无罪假设需要对违规分子处于严厉处罚,因为这是认为,一个人违规被抓只是众多违规行为的冰山一角,平时就干了不少坏事才会“天网恢恢疏而不漏"。这样才能制止违规行为。

  第五章,小概率事件不可能在一次随机试验中发生。这几乎算是统计学家的信念了。但是小概率事件有吸引人的故事性,从而博得人们的眼球。同时,如果理论上小概率事件的确很凑巧地发生了,除非经过第四章取伪和弃真严密地考察排除一切可能,否则我们就要怀疑它是我们假设的随机发生的性质了,或者说我们要怀疑它的样本空间是不是原来那个。普通人没有所谓的统计思维或许是因为他们没有机会看见众多的正常事件或者忽略掉了它们。

  《数据统治世界》读后感(四):一本以应用案例启发思维的读物

  对于从事数据工作的我来说,这本书有用并且值得向大家推荐,虽然会像某一位同事浏览后形容道:“内容就是讲故事而已嘛”。是的,就是一本用生活案例讲述数据如何统治世界的故事书。

  尽管内里全是发生在美国的事例,但类型几乎与日常生活息息相关:排队烦恼高速堵车、食品污染召回、信用评分的合理性自然灾害的保险理赔、选拔试题的公平性、药检出错造成的影响、测谎仪与反恐安全、空难的恐惧心理、彩票中奖机会等等。

  通过阅读,让我见识到统计学家用数据解决问题的思路,书中没有直接给出决策过程,仅用了实例和数字向我们证明:比起探讨解决问题的方法,更应注重解题的思维。所谓:统计技术是末,统计思维才是本。这些都会在读书过程慢慢体会

  以下是整理书中解决问题的思维概要,即便套换到别的事情,也可以像他们一样思考:

  1、迪士尼优化游客排队问题

  采用“快速通行卡”(Fast Pass)与“候补列”(stand-by)两种模式互补并行,同时张贴海报说明两者间的等候时长差异,夸大“候补列”所需时长,尽量引导客户使用“快速通行卡”。

  看完成效数据之后,读者可能会惊呼:游客等候所消耗的时间实际并没有“变短”,但满意度调查却是翻倍提升,因为游客们感知舒适了。“快速通行卡”真正用途只是让游客更好地管理自己的时间。

  2、匝道控制成了反拥堵利器

  与迪士尼案例相反了,在拥堵的高速公路上加设匝道控制,会让车主不满“额外”的等候时间,知觉管理变差,但他们忽略了技术效益:跑高速的旅行时间真的“缩短”了。

  匝道设置目的在于把行车间隔拉大,让高速上的车辆行驶速度达到一个理想的峰值,区别于拥堵时停停走走的低速效率。

  章节小结:计划管理消除变异

  迪士尼排队与高速拥堵两个问题本质有点类似,但解决思路关注点不同。

  因为迪士尼的游乐设施运行时间固定,且客流量达到“过饱和”状态,同时间段内运载游客数量无法增容,优化点集中在解决游客等候的怒气上。

  拥堵说明进入道路的车辆“过饱和”,这种饱和严重拉低通行时速,优化点则是考虑如何恒定道路的最高通行效率,尽管在匝道前等候的车主会发牢骚

  3、寻找食品污染源

  当爆发食品污染公共事件时,如何快速准确找出污染源头并不容易。假如,相关部门错判某个无辜产品召回,不但未能阻止危害蔓延,更甚会摧毁产品的声誉

  美国在这个问题上用了:“食源性疾病主动监测网”(FoodNet)数据共享以及“病例对照研究”(case-control study)对照调查。

  目的是将零散样本集中量化,降低因为人(例如:食物中毒受害者)提供有误或不完整的信息带来的错误数据,避免研究人员主观猜测”结果的可能性

  4、信用评分的合理性

  人的信用本不该由数字决定,因为人的行为极具复杂性。但如果没有信用评分技术,单靠放贷人的经验审核也不一定靠谱,所以信用评分模型之初是在争议声中诞生的,它未必可靠但有一定合理性。简单来说,就是一个用历史数据与经验沉淀统计结果的系统

  章节小结:相关比因果更重要

  上述两个模型,不再简单只关注“因果”(因为他曾吃过菠菜后出现中毒现象,所以推断菠菜是毒源;因为大多数画家不还贷,所以认为画家们都无信用),还要把周边数据组成“相关”。

  污染源侦测是基于采访回应、历史模式和生物学证据排除法查找路径

  信用评分则是基于个人特性、历史表现来推断某客户拖欠贷款的概率。

  5、选拔试题的公平性

  在饱受质疑的考题公平性问题上,引出两个影响因素:考生认知能力偏差教育资源分配不均。

  就认知能力偏差因素,“命题员”可通过数据筛选剔除偏差极大题目,余下的差异归结于考生能力不同。另一个教育资源分配不均问题,本质是“组间差异”,只能把水平相当的考生区分出题才显得“公平”。

  6、自然灾害的保险理赔

  相对汽车保险可预料、可承受的理赔压力。自然灾害尤其所谓“百年一遇”的误解能让失策的保险公司瞬间破产。“百年一遇的飓风”这概念与概率有关,并非频率,衡量标准应是经济学的损失而非年历。

  美国南佛罗里达州是飓风频发地,案例中那家失策的保险公司还犯了一个致命的错误,把内陆居民与海岸居民的投保费用混为一谈,这意味着买飓风灾害保险的内陆居民必然单向补贴给海岸居民,一旦明白过中道理,内陆居民再也不会买账。

  章节小结:混同难辨分层清晰

  很多时候认为的不公,因为大家习惯性把同类混在一起比较,这章节主要表述了,“公平”还应当考虑将不同的“组”分开。

  考试公平聚焦在把如何把不同水平的考生分层出考题。

  保险公司虽然关注点是聚集可以盈利客户,但也不能忽略高风险与低风险的组群要评级区分,对于风险过高的客户甚至考虑“排除”。

  7、药检出错造成的影响

  这节案例表达了,假如曝出运动员兴奋剂丑闻的新闻,我们一般只关注到“真阳性”(药检呈阳性,运动员使用了禁药)或者“假阳性”(药检呈阳性,运动员被冤枉)检测的结果,而忽略了“假阴性”(药检呈阴性,运动员使用了禁药)蒙混过关的事实,从数据统计模型展示,假阴性的实际数量远超出想象。

  8、测谎仪与反恐安全

  美国安全部门会利用“测谎仪”辅助审讯,虽然有起到作用,实际代价是牺牲很大比例的无辜者,但反恐问题不适合用“成本效益比”衡量。

  摘一个甄选案例:

  假设政府部门招聘10000个雇员,其中混入10个特务;

  测谎仪准确率90%,即成功找出9个特务,漏网1个特务

  按余下9990个良民中,测谎仪会误判10%也就是999个良民。

  每抓到1个特务,就会有111个良民遭受错误指控

  章节小结:消长关系的博弈

  只要检测准确率不是100%就意味着必然存在错误的可能性。

  药检出错会对清白的运动员造成声誉打击,反恐安全出错会导致不法分子漏网危害社会。对消长关系的“假阴性”与“假阳性”测定,统计学上有一条分界线,基于考虑立场不同而作出不同的倾斜:

  降低检测值:宁让更多使用了禁药的运动员蒙混过关,也要降低冤枉清白运动员的几率。(药检案例)

  提高检测值:宁冤枉更多良民,也要尽量避免放过不法分子。(反恐案例)

  9、空难的恐惧心理

  纵观民航历史数据,空难是成千上万飞行次数之中偶尔会出现的小概率事件。

  人们在看见空难新闻后,接受街头访问时,大多会对飞行安全表示担忧。统计学家则告诉我们,作为乘客关心的飞行安全问题,只在当“我”登上这班航班由起飞到降落过程的独立的概率问题。

  10、彩票中奖机会

  彩票中奖率已经是设定好的真实游戏,统计学家不相信奇迹,所以不会相信能连续中大奖的情况。

  但偏偏有一些彩票销售店的工作人员经常能中奖。这时,通过统计学分析测出这种现象已超出了正常几率范畴,事实证明,那些连续中奖的彩票销售店的工作人员的确采用过欺诈盗取其他合法彩民的中奖成果。

  章节小结:小概率的影响力

  统计学家不会因为接二连三的飞机失事而拒绝乘坐飞机,也不会因为邻居中过彩票大奖就蠢蠢欲动。因为他们很清楚这些都是大背景下的小概率事件。好比一张白纸上的一个细微小点,当你在意的时候,它貌似碍眼,但对于整张白纸还是微不足道的。

  总结

  书的最后,作者提及过:统计模型没有百分百准确甚至可能是错误的,但它是“有用”的,取决于实际应用的成效,需要不断拓展思维,实践应用修正的过程。

评价:

[匿名评论]登录注册

评论加载中……