魔鬼统计学读后感锦集
《魔鬼统计学》是一本由[美] 伊恩·艾瑞斯著作,后浪丨九州出版社出版的平装图书,本书定价:52.00元,页数:304,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。
《魔鬼统计学》读后感(一):未来属于统计学家
计量经济学的发展让经济学牵手数学,脱胎于人文社科领域,让这门魔鬼般的学科走向了与自然科学平起平坐的地位。
只要发生过的事情都是可以统计的,统计出来的规律可以让没有发生的事情变得可预知。然而预知性又导致预测结果出现偏差。所以,经济学就是这么捉摸不定,那里也有一只薛定谔的猫。后浪出版公司出版的《魔鬼统计学》作为《魔鬼经济学》(共四册)的姊妹篇,显然简练了许多,又让很多“后浪”对经济学产生了浓厚的兴趣。
有分析说,《魔鬼经济学》中确立了一个有悖于传统智慧的观点:如果说伦理道德代表了我们心目中理想的社会运行模式的话,那么经济学就是在向我们描述这个社会到底是如何运行的。我看完《魔鬼统计学》得到一个答案:“未来属于统计学家”。这句话是小奥利弗·温德尔·霍姆斯《法律的道路》中提到的一句话,也是作者最后一章第一个小标题。
作者:[美] 伊恩·艾瑞斯 出版社:后浪丨九州出版社 原作名:Super Crunchers 译者:刘清山 出版年:2020-11 页数:304 定价:52.00元 装帧:平装 ISBN:9787510893698
《魔鬼统计学》Super Crunchers:Why Thingking-by-Numbers Is the New Way to Be Smart ,直译“超级计算器:为何数字思维是变聪明的新路”。当然出版方为了商业目的对作品题目进行意译无可厚非,但是会英文的朋友根据原书题目就会明白作者想要说什么,说的就是数、数字、数据,统计就是数,当这些统计结果让你惊掉下巴的时候,统计学Statistics就可以与魔鬼Monster搭配成书。
从词源来看,古罗马人认为神为了警示人们而降下的怪物Monster,这种神灵的警告在拉丁语中就是 Monstrum ,后来这种宗教意味逐渐被人遗忘,只是用来表示“怪物”的意思,监视器Monitor也是同源词。由此可见,数据统计中真有神灵给予人类的警示,所以称之为魔鬼名副其实。世界是个数据矿,我们挖矿的过程其实就是寻找神奇的数字,以及数字统计背后的魅力。
马克·吐温说:“事实很顽固,但统计量更具有可塑性。”实际上任何事情就跟抛硬币一样,如果有两种情况,那每一种情况发生的概率就是“平分秋色”的。再复杂一点就要扩展到贝叶斯概率和贝叶斯方程,最后一个明智的决策一定是数据驱动型决策。
本书最好的地方就是不断告诉读者,不要拍脑袋做任何事情,要“反直觉”Counter-Intuitive。医生看病需要反思自己所谓的“专业直觉”,天文学家需要重新计算去证明冥王星确实不是一颗行星,一部电影不会因为明星的参与而大卖,商品经济的奥秘还是数据——数据混搭,形象的书名比平实的书名更容易畅销。至此,我也明白本书名的确立,相比也是遵循了数据驱动型决策的“魔咒”。
“图书出版是一项很高深的艺术。无法进行超级数据分析。不过,让我们从小处着手。”那就是,随机化测试,不停的找人品尝菜品滋味,总有一款会符合大众口味。然而还有一种办法,那就是研究已经成为名菜如何获得食客的青睐。这也是书中提到的关于的出书的硬核干货——回归估计,有志于出一本书,“雁过留名”之士,请你继续看完。
Lulu.com已经帮助很多人预测他们的书名能否成为畅销书。英国的统计学家阿泰·温克勒(Atai Winkler)为《纽约时报》1955年到2004年畅销书榜单榜首的每一部小说创建了数据集。他还添加了每位相同作者不太受欢迎的图书。接着他用700多个书名进行回归估计,以预测成为畅销书的可能性。这种回归可以检测11种不同属性的影响(书名是否具有“The_of_”的形式?书名是否包含人名或地名?是否始于动词?)书名的第一个词是动词、代词还是感叹词也很重要。而且较短的书名不一定更好:书名的长度不会对图书销售量产生显著影响。
总体来看,回归预测是靠谱的,比随即预测要好。也就是说,找美食家谈名菜之美,比大街上拉个吃货请他吃一顿问问口感如何要好很多,成本虽高但是结论可靠。温克勒说:“他猜测的正确率几乎达到70%,考虑到数据的性质和读者品味的变化,这已经很好了。”
读完我就在想,要是谁能将“豆瓣”数据进行一个模型分析,或许也能得出一个方程式,让那些写书的人都测试一下应该拟定一个什么样的书名。
现在我也渐渐明白,为什么电商平台出现在我首页的,总有我想买的书。要么是我被套路了,要么是我也成为套路别人的“同谋”。
《魔鬼统计学》读后感(二):带你突破经验壁垒,用数据理性解决生活难题
前一阵子我和朋友在一起吃饭的时候,说到孩子眼睛问题,朋友说给孩子网购了一瓶对眼睛有好处的保健品,吃的效果不错。我便在购物网站上查询了一下该保健品,简单看了下。过了几天,我要在网站上买东西,一打开网站的APP,跳出的推荐东西大都是和眼睛有关的保健品,改善视力的眼贴、眼罩等等。
那么网站是如何了解到我们的需求和喜好呢?简单来说就是通过系统算法,挖掘用户潜在需求,将商品展示在用户面前。而这种系统算法就是统计学。
随着社会的变迁,统计与人们的生活已经密不可分。统计学变得越来越不可或缺,在生活中应用的很广泛。人口学中的统计学应用、社会发展与评价、持续发展与环境保护、资源保护与利用、宏观经济监测与预测、政府统计数据收集与质量保证等都依赖于各类科学的统计方法。
《魔鬼统计学》本书以大量真实生动的案例,讲述了统计学如何化腐朽为神奇,干脆利索地解决一系列传统社会科学语焉不详的问题。在抽丝剥茧探究反直觉的真相的过程中,普及了统计学的基本概念和原则。正是因为其反直觉,甚至是反常识,才给人以恍然大悟的感觉,所以冠之以“魔鬼”。
在书里,作者会讲述超级数据分析在企业、政府、医疗、教育等社会各领域的兴起和影响,还会介绍几种基本的统计方法。这么做的目的,是想告诉我们超级数据分析已经能影响现实的决策,并且数据分析得到的预测结果更加准确。
世界正在迅速数字化
如今,我们都处在信息时代,无论是生活还是工作,处处都朝着电子化的方向前进。所有电子化的的基础都是用数据分析。自从人类文明诞生以来,人类便发明了各种数据存储和传输的科技,人类文明以数据的方式得以传承和保存。
从最早的甲骨文到现代文明的计算机,知识的分享速度和密度随着人类技术手段的进步一直在稳步增长。数据正在快速的被生产、传输、使用以及存储。
这种大规模数据挖掘的力量,在书中,作者采用了《诗篇》139篇开头令人毛骨悚然的话语:
你寻找我,便知道我。你知道我何时坐下,何时站起;你从远方感受我的思想。你晓得我的外出和躺卧;你熟悉我的一切。在过去,直觉和经验在主导着我们的生活,如今这种主导已经变成了大数据分析,它会使企业变成像全能上帝一样的存在。通过对数据的挖掘,数据对你的行为预测可能比你自己的预测还要准确。
这种数据分析就是统计学,统计就是主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。
比如沃尔玛超市,就是利用超级数据分析来预测需求,简单来说,就是通过数据预测哪些商品何时会短缺,何时不会短缺。这样既能降低成本,又能进一步了解顾客消费习惯。
比如2004年美国发生的一次飓风事件。沃尔玛在飓风到达佛罗里达前,就已经根据飓风的路径,提前给门店紧急配送了大量的草莓玉米饼。为什么是这个产品?因为数据显示,飓风到来时,人们喜欢这种不用烹饪、冷藏的食物。
《魔鬼统计学》告诉我们,超级数据分析已经能影响现实的决策,并且数据分析得到的预测结果更加准确。
掌握数据分析能力的人,是走在了时代前沿的人
从庞大的数据中挖掘出有价值的信息,分析出未来走向,对于企业来说相当重要。海量的数据,很多时候就是一堆庞大的数字,并不能直观反映出价值。分析师要从业务角度出发进行理解,同时还要进行分析并发现其中规律,从而找到关键点和决定因素。
现代社会建立在大数据的基础之上,经验和直觉已经不好使,统计文盲将难以生存。如今,越来越多的企业意识到数据分析师的重要性,很多人也开始投身于这个行业。
《魔鬼统计学》的作者本人伊恩·艾瑞斯就是数据分析师,虽然他在耶鲁大学教法律,但是他在麻省理工读博士的时候学过计量经济学,从保释保证书和肾移植,到枪支管制和冲动型犯罪,他曾为各种事情做过数据分析。
他曾和朋友史蒂文研究过路捷对汽车盗窃的影响。路捷是能隐藏在汽车内部的定位器,接到失窃报告时,警方可以激活发射器,采用特殊装备的警车,跟踪到失窃车辆的确切地点。而作者和朋友希望测试路捷是否有助于降低汽车的失窃率。随着他们研究调查的深入,尤其当研究报告发表时,路捷股价上涨了2.4%。
在大数据时代,掌握统计学的基本方法应当是一个人的底层能力。无论你身处在那种行业,比积累经验更重要的是学会从数据中获取知识。
可以说,《魔鬼统计学》为我们打开一个理性,客观研究世界的大门,无需高深数学基础即可感受统计学的不俗功用。
《魔鬼统计学》读后感(三):属于中国的大数据时代
看到统计学,我第一时间是想逃离,但是当我翻开这本书后,觉得如果换个名字可能更加贴近中国市场--《魔鬼大数据》。
虽然统计学和大数据这两个词,在国内已经差不多达到一个妇孺皆知的地步,但是相比之下,大数据显得更加亲民。
这本书首先从一个葡萄酒的案例来切入主题,他讲述的是这样的一个故事:一个数据分析师做了关于红酒价值的统计数据,他提出了一个公式,按照这个公式就可以计算出某个年份酒的总体品质,进而推导出哪种红酒更具有升值潜力。
他的这个做法引发了传统葡萄酒评论家的反对,因为当评论家们谈论某一款酒,会用各种散文般的文学词汇来描述酒的感觉,最终神秘的告诉别人某款酒更优质。
但对于数据分析师来说,这些修辞手法都不需要,咱们直接输入年份、降水量、温度等等数据就可以得出结论。
最终的市场结果是:数据分析师的结论正确率不见得弱于前者。 这种传统葡萄酒评论家在这本书里可以被同归为直觉主义者。他们的共性是依照自己的个人经验来判断事物。当发现自己的直觉和经验,有可能受到数据分析的挑战时,很有可能引发强烈的抵触。
而与之对应的,严格采取大数据分析的人们,正是这本书里提到的数据分析师们。
这本书其实是将社会学的方法如何从学术领域向实际决策领域传播,从书中可以看到和解释我们身边很多有意思的现象,从中我们会发现:原来大数据分析早已深入到我们生活的方方面面。
记得还在几年前,用手机打10086查询余额的时候,可以直接切入人工客服查询。而现在在进入人工客服之前,会有一堆的语音提示,他们的首选项会告诉你,你可以用自助服务来查询,而且排名第一的正是我们需要的余额查询。
这种方式是移动公司通过数据挖掘来找到用户的需求规律,进而优化了客户服务。
如果说超级数据在企业界的应用是我们最容易理解和接触到的,那么在第3章的概率治国就可以让我们看到国家是如何运用。
在印度某些偏远山区的学校里,老师缺勤问题非常严重,这导致当地的学生无法正常的接受政府提供的教育。
一位专家决定使用数据分析的方式来解决这个问题。
他在教室里设置了照相机,而且这种相机具有无法篡改的日期和时间戳的功能。 每个老师在上课的结束和开始的时候,都要让学生拍下自己在课堂的照片,而且这一记录会绑定教师的工资和出勤率。
最后的效果是:教师的缺勤率从40%下降到了20%,而且照相机学校的学生在标准化考试中的成绩明显的比以前更好,他们被学校录取的可能性也高出了40%。
在国家层面之外,另一个重要的应用是医疗领域,虽然作者提出了很多医疗领域的应用,但是我最感兴趣的是作者的这一段话:"医疗记录的迅速数字化,意味着医生终于有机会对于全民医疗保健经历中包含的丰富信息加以利用了。"
这意味着医生可以根据病人的具体情况和检查结果,从而推测出病人有可能患某种特定疾病的可能性。 不过这种推测,需要依赖医疗保健系统中无数使用者输入进相应的数据,比如医生,护士。
但我觉得这里有个细节值得商榷,这种医疗未来在中国更有可能实现。
因为和中国相比,美国各州过于自主,于是各种平台数据成为了孤岛,州医院的数据往往不会共享到中央政府。比如疫情期间,各州大量的医疗数据无法和中央数据库做联动,这导致了他们疫情的应对反应比中国远远落后。
不过美国也不见得没有解决的机会,因为随着2021年大量疫苗研制成功之后,中央政府完全可以借此机会建立全国范围的医疗数据联网,也许那时候,作者所说的医疗未来才会出现在美国吧。
这本书里对于信息全面数字化的展示,既让人激动又让人害怕。因为作者提出在未来,传感设备很可能会普遍的存在于我们社会中的每一方面,比如在商品里内置了传感设备,他们会分析出记录下我们购买商品之前的犹豫时间,携带商品的移动距离,以及是否会把这个商品和其他商品一起用。
而这些传感器很可能是纳米级别的,它在特定的环境中无处不在,像尘埃一般随风飘动。
那么那时候美国人民最在意的隐私权将会被重新定义。因为传统的隐私保护的是过去和现在的信息,而大数据所指向的隐私权指的是未来的信息。数据挖掘不仅仅会知道一个人去年做了什么事情,更多的价值在于它可以预测出一个人明年会做什么事。
而这些隐私权,在中国,你懂的。
合上这本书,如果要说有遗憾,我觉得他忽略了中国互联网这个样本。 书中所说的各种电商的预测行为在中国早期已经有了,而且做得更加的深入。但实际操作中依然有很多不足的地方,比如当我某一天兴趣来潮,在A购物网站上搜了手机的信息之后,后面一年时间,可能我的各种网页弹出推送里全是手机。
大数据的确捕捉到了我的兴趣点,但是却没有预测到我的需求可能在B购物网站里已经得到了释放。所以信息孤岛会导致每一家企业在做信息推送时候的不确定性和延后性。
但是如果是短视频平台,这问题的影响就被淡化了很多。
比如抖音app,它会根据用户关注的点赞以及下载量来推送相应的兴趣视频,同时也会不停的穿插新的兴趣视频。最重要的是,抖音会在一段时间之后,降低某个视频博主的推送频率,取而代之的是新的视频博主内容。这样做的好处是,既满足了用户对原有兴趣的维护,同时不至于因为看腻了同一个视频博主而转换平台。
如果想了解一下大数据如何应用在国外的各个方面,可以看一下这本书《魔鬼统计学》,但是我觉得:大数据的未来,属于中国。
《魔鬼统计学》读后感(四):为什么互联网比你更了解自己?为什么电商更懂你的需求?
美国有个人叫迪克·科帕肯,毕业于哈佛法学院,工作后在律所为法律客户分析数字,从法律行业退休以后,他开了家叫埃帕戈吉克斯的公司,这个公司的不同之处在于,它是专门根据剧本等因素预测电影收入的。
说到公司预测收入,大多数公司都会在年底或年初做年度规划,预测个收入并不稀奇。实际上,电影公司传统预测盈利情况的准确率大概在30%。
但是,这个公司牛掰就牛掰在:
第一它预测的准确率高达60%。
第二大电影制作工作室,如果能获得并遵循他们的建议,每年大概至少能增加10亿美元的净收入。
第三工作室可以预测出花费几百万美元制作的电影是否值得。
第四工作室能知道具体该如何提高电影的预期总收入。
那么,他们是怎么做到的是呢,主要是因为这公司训练了一个神经网络。简单来说,就是通过神经网络,优化、过滤剧本以符合大众的需求,对拍摄地点评估节省制作的成本,还可以筛选演员以最小的成本获得最大的收益。
如果照着这个案例来说,对电影制作公司来说,真的是巨大的商机,如果举一反三,能用在电影领域,其他领域是不是也可以,这么一想,我就觉得它真的太逆天了。
那么,什么是神经网络呢?
在《魔鬼统计学》一书里,作者伊恩·艾瑞斯介绍说,神经网络是一种新的统计方法,它很灵活,很微妙,它试图让计算机像人类神经一样处理信息。
神经网络未来会不会真的会像人类神经一样,这点我一点都不怀疑。说起来,现今我们都处在信息时代,无论是生活还是工作,处处都朝着电子化的方向前进。
总的来说,无论是神经网络,还是其他的统计方法,所有的基础都是用数据分析。
那么,数据分析跟我们有什么关系?我们会受到数据分析的影响吗?它到底都有哪些用处?
很显然,上面这个案例里,我们就是切身利益相关者,因为我们就是花钱看电影的人。这些问题也正是《魔鬼统计学》要告诉我们的。在书里,作者会讲述超级数据分析在企业、政府、医疗、教育等社会各领域的兴起和影响,还会介绍几种基本的统计方法。这么做的目的,是想告诉我们超级数据分析已经能影响现实的决策,并且数据分析得到的预测结果更加准确。
作者还强调,随着基于数据的决策变得越来越多,未来,最优秀最聪明的人,是既了解统计学,又拥有专业知识的人。
《魔鬼统计学》的作者就是数据分析师,他在耶鲁大学教法律,在麻省理工读博士的时候学过计量经济学,曾为各种事情做过数据分析,他还是严肃期刊的编辑。
需要说的是,这本书里所谓的数据分析指的是超级数据分析。简单来说,超级数据用的单位是太字节或拍字节。1拍字节等于1000太字节,1太字节等于1000G,更形象一点来说,一所图书馆大概有个几太字节,或几十太字节。沃尔玛的数据库有超过570太字节数据,谷歌有大概4拍字节存储量。
这么说,相信大家都会有直观的概念了。
作者几年前曾和史蒂文·莱维特(《魔鬼经济学》的作者之一)合作,研究路捷对汽车盗窃的影响。路捷是能隐藏在汽车内部的定位器,车子被偷后,不但可以定位找到,还可以顺藤摸瓜抓到偷车贼。
因为偷车的人并不知道哪辆车上有安装了陆杰,所以他们就想,它是否有助于降低整体汽车的失窃率呢?也就是,是否能产生经济学家所说的正外部效应呢?
于是,他们拿到路捷的销售数据后,考察了56座城市14年的汽车盗窃数据。他们发现,路捷可以降低整体汽车的失窃率。换句话说,如果有人能花500美元装一个路捷定位器,就能让没装的车主减少5000美元的损失。
自从他们这篇论文发布以后,路捷公司的股价上涨了2.4%。
这就是数据的优势。
《魔鬼统计学》里说,通过数据分析可以调查偏好,进而就能做出改善个人决策的有力途径。
有些企业就利用了这点,有些企业在往满足客户需求的方向努力,而另一些企业已经走在了预测需求的道路上。当然,后者是一些大企业。
比如,沃尔玛。
沃尔玛利用超级数据分析来预测需求,简单来说,就是通过数据预测哪些商品何时会短缺,何时不会短缺。这样能降低成本,尤其是滞销库存成本。
举个例子,货架上有六罐蜂蜜,如果只剩下三罐,立即就会有人知道这件事,并及时补货。这就不用存库存。
沃尔玛还善于通过消费者过去的行为预测未来。比如,2004年美国发生的一次飓风事件。沃尔玛在飓风到达佛罗里达前,就已经根据飓风的路径,提前给门店紧急配送了大量的草莓玉米饼。为什么是这个产品?因为数据显示,飓风到来时,人们喜欢这种不用烹饪、冷藏的食物。
数据分析还能预测顾客的流失,公司就能在顾客流失前,采取行动来挽留。
比如,量化赌徒的痛点。
哈拉斯赌场的顾客是刷卡结账的,因此他们可以获取顾客每场游戏的信息,他们把这些数据跟顾客的年龄和所在地的平均收入等信息结合在一起,就能很精准地预测出,每个顾客在输钱后仍然还会再来的输钱金额,这个输钱金额,就是所谓的赌徒痛点。
有了这个痛点,赌场就能在顾客痛点到来前主动出面干预,然后用所谓的幸运服务让顾客愉快的离开。
具体怎么做呢?
举个例子,张三的痛点损失是1万,当张三在赌场输的钱快到1万的时候,赌场就会有个幸运大使出现,TA会告诉张三,您今天手气不大好,您不是喜欢我们这的牛排店嘛,现在我们请您和家人免费吃牛排。张三一听立马就开心了,于是吃完牛排开开心心地回去了。
最后,张三成了回头客。
这就是典型的利用数据分析的操作。有很多公司发现了这个秘诀,如果用它来提高顾客满意度和忠诚度,我觉得挺好的,但是如果用来让消费者持续掏腰包,我总觉得哪里不对劲呐!
《魔鬼经济学》里说,数据挖掘不但能更好的预测痛点,还能准确的预测消费者具有的行为。
因此,企业就能做出个性化的服务,或者给出不同的价格。
比如,2000年媒体报道了一个事,就是亚马逊的一个消费者删除插件后,发现有款产品的价格一下降了近4美元。这个消费者突然就意识到,亚马逊可能是根据顾客特征设置了不同的价格的。也就是说,同一款产品,每个人的价格可能都不一样。
亚马逊的老板贝佐斯立马就发声道歉,并表示他们没有这么做,并表示未来也不会那么做。
但是,这个事很明显说明,很多公司可以这么做。
说了这么半天,是想跟大家说,超级数据分析真的太强大了,不光能预测我们想买什么产品,还能预测我们对产品的反应。
那这是不是说,传统的经验就没用了呢?
在《魔鬼统计学》这本书里,作者表达的意思是,因为我们人类有认知缺陷,认知偏差,又普遍过度自信,所以相对而言,做决策的时候,超级数据分析是很有优势的。
但是,超级数据分析是由数据驱动的,所以如果没有足够多的历史数据,做出的决策准确度就会大打折扣。
未来当然两者结合是最好的。
现在再想想我们当下的生活,似乎都是互联网行为。这个世界正在迅速的电子化,这就意味着,我们的行为会被记录成电子数据。
我妈一个农村老太太,已经通过直播下过好多次单了,她出门买东西现在也都是用微信付钱,我的侄女们还是小学生,她们已经跟手机分不开了,我毫不怀疑,等她们有了自己的手机和身份证后,会立刻就绑定信息。
农村尚且如此,更何况城市。
我也毫不怀疑,现在越来越多的公司想要预测顾客的痛点,可能互联网比我们更了解我们自己,它们可能比我还清楚明年夏天我会做什么。
总的来说,我觉得作者这两句话总结的非常好,就是“当公司对质量进行超级数据分析时,他们往往会帮助消费者。当公司对价格进行超级数据分析时,我们应该捂紧钱包。”
想想这些,其实有点可怕。但是,我们就是生活在这样的时代,就像作者说的,与其盲目反对这种强大的新技术,不如学习和参与这场革命。换个思路想一下,那是不是说,未来从事数据工作或掌握数据分析能力的人,就走在了时代的前沿,掌握了先机。
这也就是作者之所以写《魔鬼统计学》的初衷,他希望可以向大众灌输基本的统计学观念。“我的建议是,你应该用超级数据分析的基本工具武装头脑,而不是把脑袋埋进开始书籍的沙堆里。”
所以,从这个角度来说,这本书还是让我学到了不少东西的。以上也就是互联网比你更了解自己,电商更懂你的需求的答案。