文章吧-经典好文章在线阅读:《统计思维》经典读后感10篇

当前的位置:文章吧 > 经典文章 > 读后感 >

《统计思维》经典读后感10篇

2018-03-20 20:48:02 来源:文章吧 阅读:载入中…

《统计思维》经典读后感10篇

  《统计思维》是一本由[日] 西内启著作,后浪丨浙江人民出版社出版的平装图书,本书定价:52.00元,页数:368,文章吧小编精心整理的一些读者读后感希望对大家能有帮助

  《统计思维》读后感(一):用统计思维洞察职场因果关系

  要说什么专业最没用,统计学肯定能排上名号,很大的一个原因是没几个公司需要统计职工开始时候,统计学多应用金融和科研机构上,民营企业用得比较少。一来民营企业没有那么多资源去收集和分析海量数据,二来也没有意识到数据的重要性。但是,自从大数据、云计算提出后,数据统计变得越来越重要。查看拉勾网上的相关招聘可以发现,除了平安保险、尼尔森数据、中科院这样早就重视统计的公司,哔哩哔哩、什么值得买、QQ阅文这样的互联网公司也需要找专人分析处理收集到的数据,而今日头条的算法匹配推荐内容就是数据统计有效利用的一个例子

  然而,仅仅把统计用在大公司大机构还是太浪费了。统计就和英语一样,是一门工具,可以通过这个工具打通不同领域界限。比如,掌握了统计方法,可以通过比较几家公司历年的发展状况、企业福利,来推算出自己可能的薪资、发展前景,更加合理地跳槽。学统计和学英语也很像,一要有英语的思维,用英语的习惯表达,也就是要学会统计思维,二要学习英语的语法,也就是统计方法。《统计思维》在这两点都有涉及,通过案例解释统计思维在商务和职场中的应用。

  《统计思维》的作者西内启是东京大学医学生物统计学的毕业生。别看他是从医学院毕业的,他利用统计思维不仅在医学方面做出成绩,还为日本的多项社会创新提案提供了数据支持和分析指导,把统计玩出了跨界。现在,他又将统计思维带入商务之中,《统计思维》这本书就展示了统计在商务和职场中的具体应用。

  统计在商务中的应用是以切实的数据支撑提出改善经营、获得效益因素,包含四个方面:

  1.利用统计找出最能反映数据差别数字

  2.有了统计,就不一定需要搜集大量数据

  3.巧用统计工具可以发现数据间的因果关系

  4.统计可以用于发现抽象概念间的关系

  1.利用统计找出最能反映数据差别的数字

  假设A公司有10个人,9个人月薪5000,一个人月薪15000,这个公司的平均工资是多少?假设B公司也是10个人,9个人月薪5000,一个人月薪2000,这个公司的平均工资又是多少?也许有人会觉得两家公司都是5000,因为5000是绝大多数人的工资水平。但这是从把握现状角度分析的。把握因果的统计则是要找出最能反映数据差别的数字,月薪都是5000,两个公司的待遇不就一样了?明显不是这样。用平均值可以解决这个问题,A的平均值是6000,B是4700。这样就能看出两家公司在员工投入上的区别了。

  2.有了统计,就不一定需要搜集大量数据

  做报告常常会遇到诘难,比如数据不完整风险考虑不周,这样的反驳让人无所适从,总不可能把所有数据都搜集完,把所有风险都评估完再做决定吧。等真的做完所有工作,最好的时机错过了,兴许竞争对手就出了个类似方案了。那是否有可能通过分析部分数据得出有效结论呢?作者认为完全可以。只要把握误差的观念初中就学过的标准差就能反映出数据与真值的偏差,通过分析样本来得出接近实际情况的数据。

  3.巧用统计工具可以发现数据间的因果关系

  如果要分析客人到店次数销售额之间的关系,该怎么办呢?能简单说到店次数多销售额就高吗?如果经常到店的客户只看不买或者只在打折促销时到店,那一味的鼓励客户进店反而起不到提高销售额的作用。要分析两个数字之间是否存在因果关系,要用到回归分析,最简单的说就是求y=ax+b这样的一条直线。y是想要的结果,x是引发结果的原因,x和y之间有没有关系,利用数据求出来就一目了然了。

  4.统计可以用于发现抽象概念间的关系

  如果要分析一个抽象的因素和结果之间的关系怎么办呢?比如大家都很熟悉品牌的作用。有的公司投放品牌就有很好的收益,有的公司却适得其反。然而品牌又不像到店次数一样直观,可以直接得到数据,那该怎么办?可以用因子分析,把包含品牌和销售额的材料归为一类,以点的形式标在坐标系上,若是要考虑别的因素就建立新的坐标系。

  统计思维是把所有信息转换成数字的思维,将数据以公式、图表的形式呈现出来。数字是客观的,可以最大程度地减少主观影响。处理数据的目的则是找出最能影响结果的那个数据,也就是平常说的最优方案。这个思维和商务简直是天作之合,因为商务也是要从众多的因素中找出能最有效地促进销售、获得收益的那一个。

  这种数字化的思维不仅在商务中有很重要的作用,在个人的职场中也有很重要的帮助。比如前面提到的跳槽。善用统计思维还能把自己的工作化成数字,今年做了多少项目,每个项目花了多少时间,取得多少成绩,A项目和B项目的区别在哪里,这样不仅能看出自己的工作效率方法也能看出成绩所在。最直接的,就是能拿着这个当年终总结了。统计思维是一个工具,可以帮助使用者建立一个因果关系的思考方法,在纷繁复杂现实世界中找到最重要、最关键的原因。相信拥有了这种思维,无论是处理工作和是个人生活都能更有条理,更加顺利。

  《统计思维》读后感(二):统计学是谎言吗?

  马克·吐温曾说:“世上一共有三种谎言:谎言,糟糕的谎言,还有统计数据。”

  如果留心新闻与弹窗,统计数据的“骗局”与荒谬性确实足够令人震惊,如果光凭统计数据,可以得出“过马路走横道线出车祸人数更多”,“妙龄熟女20年每天一杯奶茶变中年女子”这样的标题党。而英国皇家学会成员大卫教授也于近期发表论文,其中援引了斯坦福大学流行病学家约翰·安尼蒂斯发表的另一篇论文《为什么大多数已发表的研究成果错误的》中的一项结论:最近有研究者重复了100项实验心理学的不同研究结果,发现仅38%的统计结果重复了原来的结论。

  统计数据是否真的有那么不堪?马克·吐温的话多少有些夸张的成分作为科学一部分的统计学,之所以蒙上了不科学的色彩,甚至成为谎言蒙蔽我们的内心,很大程度上是因为很多人不具备东京大学与哈佛大学西内启研究员所说的“统计思维”。

  作为一位曾经的纯文科生,为了让毕业论文更有说服力(不只像一个人的话说八道),也试图在文中插入了数个统计图表。因为甚至不曾选修过高数,因而病急乱投医地翻了数本带着“统计学”名号的初级书,但身为统计学和数学基础少女,多次无功而返。听闻东大医学部生物统计学出身的西内启在日本颇为出名,在出版第一本统计学《看穿一切的统计学》时才32岁,却引爆了日本商务人士学习统计学的热潮。怀着试一试的心情,最近阅读了西内启的两本统计学的入门书——其处女作《看穿一切数字的统计学》,以及新出的《统计思维》;前者更偏重理论,后者则更注重实践,多少有了些许提高。

  在《统计思维》一书中,西内启并没有对统计学的讨论集中于最常见的“把我现在”和“预测未来”,而将目光聚焦于统计学更源头的部分——洞察人类行为的“因果关系”。唯有弄清统计思想与分析方法,才有可能看清现状,并根据复杂的状况做出更为准确的预测。基于这样的思路,西内启在书中首先讲解了均值、比例等最基本的统计学工具,随后介绍了统计学中假设检验的思维方式,进而对回归分析、因子分析和聚类分析等进阶方法进行了讨论,目的则皆集中于统计实践。

  诚然,对于高数零基础的读者而言,对于《统计思维》中的进阶方法部分内容并不能完全吸收,但书中提高的统计思维则深入浅出可以被启发借鉴

  首先,要用更优的统计视角解释变量。所谓有意义的统计,需要把握三点:

第一,因果关系并非“太过显而易见”;第二,能够在发现因子对结果的影响后,该原因因子可控;第三,至今为止位被关注和分析过。

  同时,最有效的统计工具往往存在于最基本的元素之中,比如我们从小就熟知的“平均数”。在看到可支配收入统计时,我们常常觉得自己被“平均”代表了,正像比赛中需要去除最高分与最低分,在描述现状的统计学中,中位数与众数更具代表性。然而,西内启却说,对于目的是“洞察”的统计学,并不需要太过在意中位数和众数,反而是伟大的高斯最先提出的“平均数”。为了洞察因果,我们需要的并不是一个作为代表的粗略的均值,而是对于总体的把握,在这一点上,平均值确实更为称职。如若要稍微专业一些的角度来考量,关注到数据本质呈正态分布,同样也可以得出平均数贴近“真值”的结论。在高斯之后,同样赫赫有名的大数学家拉普拉斯曾如是总结:

“如果数据的分散服从正态分布,最小二乘法就是最优的推测方法,作为其结果,平均值是最优的推测值。”

  此外,要提升统计功效,即“在存在差异的假设成立的情况下,认为显著性差异存在的概率”,需要警惕α错误与β错误。所谓α错误,是指明明不存在差异却认为存在,也被戏称为“冒失鬼的错误”;而β错误,则指明明存在差异却没有发现,被称为“糊涂虫的错误”。统计学的厉害之处,正在于其系统化了在“冒失鬼”和“糊涂虫”之间做出正确判断的方法,即统计性假设检验。对于我们文科生更可能接触到的社科类调研,则牵涉到样本量的设计,“将最终的误差范围调查所需花费的时间和金钱放在天平上,估算必要的数据数量”。如果能将比例标准误差(SE)在可接受范围内,大数据并不是必须的,适宜范围的数据才是统计的重点。置于什么是可接受范围,也可以理解为“置信区间”的选择,则在于抉择,“问题归结到得失上”,结论偏差的可能性足够小,即被认为不可能。目前,习惯用5%作为界限,不过值得一提的是,这个比例并没有严格的数学依据,似乎只是因为伟大的统计学家费希尔曾经写道:“用5%来判断p值很方便”,统计学的基础假设,竟充满了随性的色彩。

  总而言之,要理解统计学的奥义,洞察数据与行为之间的“因果关系”,而不被谎言所迷惑,确实有思路可循。归根结底,统计只是理解世界的路径与方法,并不是目的,最关键的自然并不是数据本身,而是从数据中发现有意义的变量,并通过控制变量影响项目的结果。

  《统计思维》读后感(三):统计思维让你推开用数据说话的大门

  说起统计,我的第一反应就是平时生活中的加减乘数,如统计人数订车票,或者清点物资入库出库,或者计算一下参会人员的出席率等等这样简单的运算。真正让我意识到统计思维的奇妙之处还要从一个故事说起。

  那是关于辽沈战役中林彪利用战况数据擒拿廖耀湘的故事。两军对战,林彪要求下属每日统计每支部队歼敌俘虏的人数,缴获的枪支、火炮、车辆等物资数量。同时还要将这些数据分类,人数要分军官士兵;物资数量要分长枪短枪、大车小车等。一天夜晚,林彪正在听下属汇报每支部队的战况数据,突然喊停发问为什么在胡家窝棚缴获的短枪与长枪、小车与大车、军官与士兵的比例比其它战斗略高?见无人应答,他大步走向地图找到胡家窝棚的对应点推断此处就是敌人指挥所的地点,随后连夜口授命令追击从那个地方逃走的敌人,果真抓住了对方的指挥官廖耀湘。

  为什么林彪会注意到短枪与长枪、小车与大车、军官与士兵的比例,因为高级军官一般佩带短枪,坐的是小车,再加上军官与士兵的比例可以推断这群敌人的军衔很高,极有可能就是指挥官所在的部队。统计思维不仅是统计数据,更重要的是看清楚数据隐藏的含义,洞察数据背后的因果关系。这也是日本作者西内启的《统计思维》的著作理念,在大数据时代瞬间洞察因果的关键技能

  西内启毕业于东京大学医学部生物统计学专业,目前为日本多项社会创新提案提供数据支持和分析指导。前作《看穿一切数字的统计学》引爆日本商务人士学习统计学的热潮。本书《统计思维》则更加侧重于实践运用,用实际中的案例和清晰的图表从易到难讲解介绍平均值、比例、标准差、标准误差、Z检验、T检验、回归分析和Logistics分析等在商务实战中常用的统计知识和方法。

  《统计思维》这本书不是简单的入门书籍,它更像是统计学运用的心法。就像书中所言即使全部掌握了本书的内容,也不能说就彻底掌握了统计学。只能说学会了这些内容,你就站在了统计学的起跑线上。用更加形象的阐述对书中的理解,假设有一个专门从事统计分析的S公司,那么《统计思维》这本书如同S公司的参观攻略。看了这本书你能感受到统计分析的博大精深,知道S公司各部分之间的功能及如何组合起来运转,但具体如何操作只是一笔带过。因为一旦涉及操作过程会需要用到很多线性代数和微积分等数学知识,这对普通读者来说很艰辛,并且在实际运用中这些计算操作往往交给SAS、R等统计工具去处理。

  所以《统计思维》更专注于把统计思维变成读与写一样,成为有效率公民的一种必备能力,它旨在提升你对统计方法作用的理解而不是具体操作,就像把读者定位于S公司的CEO来讲解而不是当做S公司的员工来培养,让读者知道如果你是S公司的CEO,你会知道下属中谁能够干什么,并且如何唯才适用才能发挥最大功效。

  它从简单易懂的普通员工:平均值、比例、标准差和标准误差等开始,这些都是统计分析中基本要素;其次介绍中层领导:P值、Z检验和T检验等来判断结果和解释变量之间是否有无法认为是偶然的关系;然后介绍高层领导:回归分析和Logistics分析等用于从一堆数据中找出对应的结果和解释变量有哪些;另外还有一些重要的高层助理,它们就是因子分析和聚类分析,帮助高层领导在实际分析中精简解释变量。整体的统计方法框架如下图:

  在正常的商务活动中,S公司是怎么运作的呢?如下图所示。一般解决问题我们会循序渐进,先出小兵再出大将。但S公司不一样,一开始就先用大将回归分析或Logistics分析,先确定结果和解释变量之间是否有相关性或者因果关系,接着高层助手因子分析和聚类分析在需要时会来协助精简解释变量转换为易于理解或者处理的形式,然后再通过中层领导Z或T检验来验证结果。

  《统计思维》让你从全局把控者的角度去了解统计学,看得全面但学得笼统。但哪怕只是了解书中笼统的知识,如果没有好好学过高中数学也是难懂。另外为了补充本书没有深入讲解计算方法的短板,它把书中涉及到的数理知识和公式变成17个数学附录附在末尾。幸好读者把这些方法放在末尾,不然普通读者难以读下去,但认真啃读理解,对后续深入学习统计学有帮助,在统计学的跑道上起跑时就不会那么辛苦了。另外这本书的终章总结了全书的内容和在实际中的使用顺序,更人心喜的是本书无法学到的3个知识点这部分,这是作者正视这本书中所舍弃的部分,让想深入学习统计学的读者知道如何去实际操作,并且了解统计学的前沿情况,让你看统计学基础跑道之上的升级跑道是怎么样的。对未来的美好向往能使人加强攻克现实困难的信心,对普通的读者而言,统计学的知识难点不是一般的多,这也算是作者对学习统计学读者的勉励吧。

  在信息大爆炸的时代,在大数据越来越火的时代,如何透过纷繁复杂的现象,用数据说话,洞察现象背后的因果关系做出令人信服的判断,《统计思维》算是不错的起步引导。它让你先看统计学这座大山概况,为你指引山路,让你在跋涉时不至于身在此山中,云深不知处,但这艰难的爬山之路还是要一步步走的。若有一天能到达顶峰时除了一览众山小的心旷神怡外,必然也会记得登山途中那不知名的小花、大树、奇崖怪石,真正做到把统计学这座大山装进大脑,如同活地图一般能在山间上下穿梭,怡然自得。

  《统计思维》读后感(四):因为"赌气",这位作者写了本能硌掉牙的"硬书"

  文/黄老邪

1.

  2013年,在日本有一本很有名气的畅销书,叫《看穿一切数字的统计学》,尽管这本书畅销37余万册,但是仍然有很多读者在看完之后觉得不过瘾,认为这书写得不够硬,缺少统计学的干货。于是,书的作者"一气之下",又出了一本书,名字叫《统计思维》。

  这位作者叫西内启,他毕业于东京大学医学部生物统计学专业。曾任东京大学研究生学院助理讲师,大学医院医疗资讯网络研究中心副主任,哈佛大学癌症研究中心客座研究员。目前在为日本多项社会创新提案提供数据支持和分析指导。

  诚如西内启在序中所言,他写这本《统计思维》的初衷就是为了弥补读者朋友们对于统计学这门知识的硬货渴望。但这本书真的非常硬,牙口不好的读者恐怕会被硌掉几颗牙下来。

2.

  《统计思维》全书共计28万字,包括序章、1~4章、终章、附录,共七部分。序章主要讲述作者出书的背景,并概括性的点明本书的主旨:统计学在商务社会里的重要意义与使用方法。书的主体部分是四个章节,通过商务社会里的具体案例,从浅入深,讲述了统计学中均值,方差,偏差,标准误差,概率,正态分析,t检验,x检验,一元回归,多元回归等基本概念跟用法。终章对全书做总结,再次归纳了统计学思维在商务实践中的使用方法跟分析顺序。

  值得一提的是,作者西内启很能照顾读者朋友,为了避免大家看到正文中出现一大串的公式而失去阅读耐心,他把本书用到的所有统计学的概念跟数学定义,包括推导过程全部作为附录放到了书的最后,非常方便查阅。

  不同于传统的统计学教材,《统计思维》这本书并没有过度纠缠在统计学大量专业术语的概念定义跟公式计算。这本书最大的亮点在于写作的出发点跟写作策略。作者更侧重通过具体的商务社会的案例,用逐层剥洋葱的方式来详细阐述,如何用统计学的思维来洞察这些案例中呈现给读者的数据背后的规律。

  正如作者在书中反复强调的观点:

统计学有三大功能:把握现状、预测未来以及洞察人类行为的"因果关系"。而在商务领域,无论身处哪个行业,哪种职位,都需要用数据来洞察个人和集体的行动,进而寻找改变这种行动的方法。

  说一个例子。如果有人提出,“在一个企业或者职场中,参加过体育社团的人更容易升为主管”,这样的结论你怎么看?

  一般来说,普通人在分析一件事情时往往依靠感觉,但感觉一般来说是具有欺骗性的,我们需要用数据来说话。如果看过《统计思维》这本书,你或许就可以尝试用下面的方法来进行分析。

  第一步:收集数据。通过企业的人事部门跟自己的调查,你可以得到下面这张数据表格。

  第二步:数据的统计分析。

  很多人拿到这个数据可能只会进行一个简单的比例计算。譬如说,计算出参加过体育社团的人成功率是21%(用63除以300),没有参加过社团的人的成功率是18.5%(用37除以200)。因此参加过体育社团的人成功率更高。这个结论充分吗?

  要知道,即使是投硬币,多次出现正面的情况也是有着一定的概率的。仅仅用一个比例值来得出结论,这在商务社会里是非常不够用的。根据本书作者提供的统计学分析思路,这个问题的正确处理过程应该是下面这个样子的:

  (1) 进行标准误差SE计算。参加过体育社团者成功率的SE是对P*(1-P)这个值开根号,这里的P就是刚才简单计算得到的21%,可以知道SE的结果为2.35%。

  (2) 确定置信区间。根据统计学基本定义,比例或平均值在正负2SE的置信区间内,代表在5%的显著性水平下无法否定的假设的水平,这就是著名的95%置信度。因此可以计算出参加过体育社团者成功率在正负2SE之间的概率是16.3%~25.7%。

  (3) 用同样的方法计算出未参加体育社团者成功率的标准误差SE位于13%~24%之间。

  (4) 计算参加体育社团者成功率与未参加体育社团者率比例之差的标准误差。这里需要用到一个z检验的方法。最后得到这个比例之差的2SE区间是-4.8%~9.8%。

  这意味着:在双侧5%的显著性水平下,我们无法否定参加过体育社团者成功率比未参加才的高出9.8%的假设,也无法否定参加过体育社团者成功率比未参加者低4.8%的假设。

  翻译成人话就是:无法确定哪一方成功率更高。

  上面这个例子大家可能会觉得过于简单,似乎不值得这么兴师动众来分析它。要注意,这里作者仅仅是用一个简单的例子来说明用统计学思维来分析现象的科学方法。而在真正的商务社会里,我们遇到的问题远比上面这个例子要复杂得多,比如说商场的消费者购买力的分析,如何根据购买者的性别、商品的种类、广告的投放力度来进行分析,比如说电子商务网站中用户的点击率与喜好分析,商家的满意度调查等等。

3.

  在互联网时代,数据的获取相比之前变得前所未有的容易,但这些数据如果不采用科学严谨的统计方法来处理,造成的信息浪费姑且不说,很多时候,通过浅显的数据分析得出的结论因为站不住脚,反而会误导决策者的战略制定,给企业造成严重的损失,这才是真正值得我们重视的。

  不可否认,因为语言跟教学区域的不同,《统计思维》这本书翻译出来的内容,跟我们国内常见的统计学相关书籍中讲解的方式方法并不相同。但这并不打紧,如果你有一定的概率论基础,高中时学过的那些排列组合的基础知识还没有完全遗失殆尽,《统计思维》这本书还是值得一看的,毕竟这本书的立意跟讲解角度确实足够新颖,很多不起眼的地方都着实能够让人眼前一亮。

  好了,朋友们,这样一本"难啃"的硬书,你有没有勇气下嘴呢?

  —The End—

  《统计思维》读后感(五):如何寻找事件背后的原因?

  打开电视,看到一个护肤品的广告。 广告里的女明星皮肤细腻的看不到毛孔,整张脸白里透红,非常美丽。 这个时候打出一串广告语和护肤品的品牌。 你是否有些心动? 同样的场景还出现在洗发水广告中,那个拥有一头乌黑柔顺长发的女孩子告诉你,她使用的是XX品牌的洗发水。 你是否有些心动? 一位天使脸孔,魔鬼身材的模特告诉你,她就是吃某某代餐的,不仅肥肉没有了,皮肤也变好了。 你是否会心动?

  记得曾经在《清醒思考的艺术》中看到过,人们往往会相信广告,是因为陷入了一个误区。 并不是因为广告里的明星、模特、气质美女不真实,而是你自己产生了因果偏误。 到底是因为模特的身材好,所以减肥产品才找到她做广告,还是因为模特真的是因为吃减肥产品才会有这么好的身材? 可见,减肥产品与模特身材之间并没有因果联系。 可能会有部分的关联关系,但是关联度有多大,不分析我们是无法得知的。

  在我们做决策和判断的很多时候,都会被“因果偏误”误导。 比如觉得降价就会提升销量。 比如觉得访问量提高是因为优化了首页的配色。 比如觉得一个模块没有接到客户反馈是因为这个模块设计的非常完美。

  记得在二战时期,美军对德国和日本法西斯展开了大规模战略轰炸,每天都有成千架轰炸机呼啸而去,返回时往往损失惨重。 美国空军对此十分头疼:如果要降低损失,就要往飞机上焊防弹钢板;但如果整个飞机都焊上钢板,速度航程载弹量什么都要受影响。 怎么办? 空军请来数学家沃尔德。 沃尔德的方法十分简单。 他把统计表发给地勤技师,让他们把飞机上弹洞的位置报上来,然后自己铺开一张大白纸,画出飞机的轮廓,再把那些小窟窿一个个添上去。 画完之后大家一看,飞机浑身上下都是窟窿,只有飞行员座舱和尾翼两个地方几乎是空白。 那么是不是应该在弹孔最多的地方焊上钢板呢? 沃尔德的选择是相反的。 沃尔德告诉大家:从数学家的眼光来看,这张图明显不符合概率分布的规律,而明显违反规律的地方往往就是问题的关键。 飞行员们一看就明白了:如果座舱中弹,飞行员就完了;尾翼中弹,飞机失去平衡就要坠落——这两处中弹,轰炸机多半就回不来了,难怪统计数据是一片空白。因此,结论很简单:只需要给这两个部位焊上钢板就行了。

  同理,有很多时候我们找到的是关联关系,而不是因果关系。 而我们其实可以利用这种关联关系进行分析,去找出因果关系。 在《统计思维》中,作者就介绍了这种方法。 之所以分享给大家这种方法, 并不是说你一定要像数学家或者统计学家一样掌握各种方差、概率定理,而是要掌握这种统计学的思维。 不要再被关联关系迷惑,也就是《统计思维》中说的“冒失鬼”。

  冒失鬼很有意思,总是很轻易的下结论。 “因为我们上个版本才更新了首页的设计,这周访问量就上来了,肯定是因为这次的首页设计更新的原因。” “这个模块从来没有接到过用户的投诉或者需求,说明这个模块是那么的完美。” 但实际的情况很可能是,因为一个大V对这款软件的推荐,所以造成了访问量的上升。 因为这个模块根本没有人用,所以没有用户进行投诉或者提出需求。

  那么怎么避免做个“冒失鬼”呢? 在《统计思维》中给出了一个进行统计分析的流程。 我觉得即便你不了解那么多的公式和理论,也可以将这个流程牢记于心进行应用。 因为它其实是描述了一种思维的方式。 如果你需要进一步的进行量化的分析,得到切实的数据支撑决策的话,可以再了解一些统计学理论的知识,或者求助专业人士。

1.找出可能的关联因素

  在《统计思维》中说的比较专业:用多元回归分析/ Logistic 回归分析关联性。 我们不那么专业的话,可以通过其他的方式寻找关联因素。 比如:问卷。 比如:头脑风暴。 我们需要尽可能多的找到可能的关联因素。 比如访问量提升,是因为首页的改版、因为宣传、因为优惠措施、因为关联推荐、因为心血来潮、因为学生放假……

2.解释结果

  我们尝试将之前找到的那么多可能的关联因素进行解释。 是否这样的原因真的会导致访问量上升的结果。

3. 分析

  因为头脑风暴或者问卷等方式收集到的信息是比较庞杂、零散的,我们可以将这些信息进行分析、分组。 在这个过程中,可将可能性非常小的进行剔除。 那种显而易见的因素也可以剔除。 比如,每年学生放假的时候,访问量都会有小幅度的提升,但是不会有这么明显。 那么可以考虑“学生放假”可能不是产生本次大幅提升的主要因素。

4.对分析结果进行验证

  《统计思维》中提到的是“用t检验或z检验验证A/B测试的结果。” 简单来说,因为我们想找到本次访问量大幅提升的原因,为了避免我们找到的是关联因素,所以我们需要进行反向验证。 比如,我们之前找到的一个因素是“因为某知名网站的关联推荐造成了访问量的提升”。 那我们就需要进行验证了,是因为某知名网站的关联推荐造成了访问量的提升,还是因为我们访问量提升了,从而让某知名网站对我们进行了关联推荐?

  经过这四步的分析后,你基本可以确定原因是什么了。 这个原因可能不止一个因素。 而如果你想进一步知道这些因素哪些作为主要因素,哪些作为辅助因素,相互之间的关系是怎样的。 那么就需要用到专业的统计学知识了。

  但是我觉得对于大部分情况来说,找到原因基本上可以达到目的。 比如你发现访问量提升的原因是之前的宣传到位,那么你可以判断宣传的方案是有效的。 以后有类似的项目也可以这么去做。 而不是“冒失”的将所有的精力耗费在“继续提升首页配色设计”上。

  写在最后 有一本书其实和《统计思维》有异曲同工之妙,叫做《用户体验度量》。 只是说《统计思维》应用会更加宽泛,作者强调的不是某一个专业或者领域,而是比较普遍的应用。

  小婧是一名行走在实践路上的资深业务分析师(BA),如果想与我同行,就请关注我吧!

  《统计思维》读后感(六):面对市值300亿的商机,你抓得住么?

  在很多公司中,都存在一种“多做多错,少做少错,不做不出错”的想法,很多岗位尸位素餐。可是为什么很多商务人士即使捕捉到了能够为公司提高利润的机会,或者发现了导致问题的可能因素,仍不敢提出意见或采取行动呢?

  因为他们没有有效的工具帮自己验证问题到底是偶然还是必然,因此只能出于“谨慎”的态度,从不主动主张任何假设,更别说相信假设并采取行动——不做就不会出错嘛——将明明存在的差异自动忽略,总是说“因为未能周密的了解,接下来让我们谨慎的讨论”,然后更多的倾向于不了了之。

  但是和这些人相反,有一些商务人士就能够通过有效统计工具,提出假设并验证假设并从中找出商机——比如说从传统酒店财务报表的数据分析中跳出来的市值300多亿的七天快捷酒店——如果是你,这商机,你看得见么?看到了你又敢不敢抓住?

  没有人想错失这样的商机,无奈的是不懂得有哪些可以利用的统计工具,以及如何利用他们洞察商机。这本《统计思维》将能让你带你入门。

  这本书的作者西内启是日本畅销统计学入门书籍《看穿一切数字的统计学》的作者,他认为自己这本书应该算作统计学入门的入门,那个时候他只希望通过自己的书让更多的人关注到统计学,进而去找到适合自己的统计学入门书籍进行阅读。而读者们的反馈让他意识到大多数统计学入门教科书并不符合商务人士的需求。

  因此作者西内启写这本《统计思维》的初衷就是希望写出一本适合商务人士看的、为了商业目的提供的统计学教科书。

  统计学在商务上的应用,主要在于“把握现状”、“预测未来”、“洞察人类行为的因果关系”这三个方面。西内启的这本书主要涉及的是“洞察人类行为的统计学”,以人类的行为和社会状态的变化为主要研究对象,目标是用数据来洞察个人和集团的行为,进而寻找对其行动和状态进行改善的方法。

  通俗来说,商务人士可以利用统计工具、通过数据分析,了解和他的业务相关的所有相关人(比如消费者)或企业(比如供应商、渠道商)的行为,从而找到提高商业利润的方法。

  西内启自己就是这样一名善于利用统计工具的商务人士。西内启提到,自己从年轻时开始直到现在,每日都在运用统计学技术分析横跨各领域的实证数据并将其活用;他认为正是这样职业基础,让他更懂得如何将统计知识活用于商业活动,才让他更容易写出适合商务人士看的统计学入门书。

  那么商务人士认为现有统计学入门书不适合他们的理由到底有哪些呢?

1、出现公式就读不下去2、乍一接触到统计工具,不知道它的含义3、不知道各种方法对自己的工作有何助益4、不知道自己工作适用哪些统计学知识

  这本书和以上所说的“现有统计学入门书”又有哪些不同呢?

  1、本书正文中尽量少的出现公式,即使有少量公式,也尽量用文字进行表述而非字母和符号。

  所有的公式及其证明都集中在正文后面的《数学附录》(本书的275-347页)中,但作者确实做到了即使不看正文后面的《数学附录》,也能清楚的明白作者想要表述的意思。

  2、在介绍各个统计工具/方法时,书中使用了大量商务中的实例,让我们清楚的了解到这些工具的除了数理含义之外的实用含义,以及在工作中的作用。


  比如说,在第二章解释“统计学假设检验”这个工具时,用商务中人力资源的“参加了体育社团是否在工作中更容易成功”案例来说明,让人很清楚的意识到原来“统计学假设检验”这个工具是用来判断,两个事件之间的联系是偶然还是必然;同时这种验证能够让我们规避在商务中冒进的决断或者因为不确定而产生的不作为的消极态度。

  3、本书终章部分向我们介绍了商务中书中的各统计知识和工具可以在什么情况下被用到,以及在商务实践中我们可以以什么顺序去运用到这些知识进行分析思考。

  终章部分,就像这本书的领子一般,建议商务人士可以在阅读完序章后,直接跳到这部分,先去了解这本书中介绍的各种知识使用顺序和使用情景,也许就能以更清晰的目标完成本书的阅读了。

最开始,你要了解两个核心概念:

  1)outcome——你最终想要控制的结果。

  举例来说,你想要的结果可以是提高用户消费金额,或是降低用户投诉率,或提高用户忠诚度。

  2)解释变量——和outcome有因果关系,可以帮助你控制outcome的原因。

  举例来说,用户的年龄、性别、职业可能都会成为影响用户消费金额的因素。

  商务实践中利用统计学进行分析,到底要按照什么顺序、使用到哪些知识呢?

  首先第一步是数据整理和查验

  这一点,并没有在本书中用更大的篇幅说明,而只是在终章的最后提到你可能会使用到的统计分析工具与实际数据的处理。SAS、R、Excle这些常用的工具很容易获得和使用,但工具的熟练使用并不代表你一定能够在商务上利用数据有更好表现,更为重要的是“从实际数据中找出outcome与解释变量是什么的能力”和“加工现有数据的能力”。

  因此在完成数据整理和查验之后,第二步最重要的就是确定想要最大化活着最小化的outcome是什么。这一步的核心则在于对于业务目标本身的深刻理解。

  第三步就是寻找outcome有因果关联的解释变量。

  可能和outcome有关联的解释变量非常多,选择什么样的解释变量才有分析价值呢?

  基本原则有三:

  1)最好寻找那些可以通过广告、商品制造等手段或方法可以操控的解释变量,以便通过操纵该解释变量创造利润。

  比如说选择“品牌形象信任度”这样的解释变量,可以通过投放广告这样的方式提高,以达到增加销售的目标。

  2)选择那些即使不可以操控,但却可以“调整”的解释变量,通过调整改变量创造利润。

  这是什么意思呢?举例来说,某品牌发现自己的产品女性消费者的消费金额比男性更高,即使我们不能改变到店顾客的性别,我们可以调整其他因素(比如广告投放渠道、店面选址或装修风格等),让女性消费者更容易获知该品牌信息、更容易被吸引到店等。

  3)选择那些即使无法直接提高收益,但在其他角度和利益相关(比如说减少成本)的解释变量。

  这一步中可以使用的统计工具是是“多元回归分析”和“Logistic回归分析”,通过分析关联性寻找想法,解释结果。这一步中在必要的时候,通过统计工具“因子分析”/“聚类分析”精简数据。

  第四步就是尝试从分析结果中得出结果。

  获得的结果是否具有必然性,可以通过统计工具需要进行验证。在商务中可以采取小规模的A/B测试的方法进行检验,使用t验证或z检验验证A/B测试的结果,验证想法的有效性。

  作者对于从统计数据中获得的可能存在的商业机会的态度非常明确和积极,那就是“如果发现了可能带来利益的想法,就用恰当的随机对照试验或A/B测试去验证它”。

  以上所有提到的统计工具都可以在本书的第1-4章找到。同时在书的最后《数学附录》中可以找到相应公式及其证明。

  我们生活在一个一切都被数据化的时代,只有备好有力的统计工具,才能拥有透过数据参看世界真相的洞察能力,获得先机。

评价:

[匿名评论]登录注册

评论加载中……