让数据说实话 | 清单

逍影歌 逍影成长利器 2018-05-06

昨天,介绍了《简单统计学》,既然是本好书,那还是把里面的关键信息榨干了再说。不过,各种具体的案例分析,还是需要你去阅读,才能对各种统计学方法有深刻的认识。

好话不多说,下面帮你整理了一份清单:

1、当你面对眼前复杂事物,内在愿望驱使你去解释,于是会产生两种认知错误:一是你很容易就被模式以及解释模式的理论所引诱;二是你紧盯支持这理论的数据,却忽视与之相矛盾的证据。

2、人通常倾向于寻找模式,并相信自己所观察到的模式是有意义的。不要天真地认为模式就是证据。你需要一个符合逻辑、具有说服力的解释,并且需要用新数据对这种解释进行检验。

3、你会自然而然地根据你看到的现象得出结论,但你的结论可能会失真。一是因为人们所做的事情是他们自己选择的,你观察的特别可能并非是源于事情,而是反映了选择做这事的人的个性,这是「自选择偏差」;二是你没有看到的事情,导致你陷入「幸存者偏差」。

4、为了避免「幸存者偏差」,我总结为「走着瞧」思维,就是从过去开始向未来展望。比如研究伟大公司,要从40年前在经营中的公司开始研究,看看他们接下来发生了什么。

5、做数据比较,要注意两点:一是时间点,你要在哪个时间跨度内比较;二是比较点,你比较的是相对差距还是绝对数值。

6、当你听到一个有争议的论断,你觉得它违反直觉,这就是一个值得怀疑的理由。你要考虑数据是否存在问题,考虑因果关系是否颠倒,考虑人自身出错的可能性。记住:数据并不比思想重要。

7、图像也会扭曲数据。你要留心三点:一是数轴上的零点是否被忽略、数轴上是逗有刻度和单位;二是图像的纵轴和横轴是否颠倒,比如将常见的时间轴放在纵轴;三是图表有利于展示,但图表垃圾却会分散你的注意力。

8、运用常识思考你所回答的问题是否正确,假设是否合理,结果是否可信。

9、假阳性问题与条件概率的混淆有关。在某些情况下,一项检测很有可能显示阳性结果,但阳性检测结果并不能认定疾病存在,它可能是假阳性。

10、混杂因素常常出现在观测性数据的研究中。当聚合数据被分解时,会发现结论发生逆转,这时应该对数据进行分类,并发现他们之间的系统性偏差,用分解数据来推到结论。

11、你喜欢在数据中寻找模式,并未你所看到的模式编造一些理由。即使在随机事件中,仍然会出现连续的巧合。好手感和差手感很可能存在,但它比我们想象的要小得多。

12、表现好的人并不会因为受到鼓励就变差,表现差的人并不会因为受到教训就变好,这一切都是均值回归,好与坏,都会回归正常的平凡状态。

13、发生在你身上的坏事并不会自动个提高发生好事的可能性。要想改变运气,你通常需要改变你自己的行为。

14、有一种错误,成为「德克萨斯神枪手」,就是指一个没有射击技能的人用一把枪,向谷仓的一面墙射出大量子弹,然后在弹孔最多的位置画上靶心。警惕为了解释某种现象,而故意寻找数据聚集的区域来解释。你需要确认理论是否合理,另外就是用新数据来验证。

15、最好是,当存在疑问时,不要排除数据。你要对丢弃数据的研究保持警惕。问问自己,被忽略的数据是否存在非常明显的错误。

16、如果统计结果看上去不可信,应对数据和检验进行检查。即使是专业人员也会犯错误。

17、不同寻常的说法需要不同寻常的证据。对于犯错的可能性持有包容心态是一件很难做到的事情。

18、通过短短几年的数据外推未来,人们可以编造出许多令人欣慰或恐慌的预测。当对统计比较存疑时,问问自己,开展这研究的人在计算之前是否进行了思考?是否拥有具体而清晰的理论?是否受到未经污染的数据的检验?数据是否受到了挖掘和搜刮?

19、不要仅仅观察数据,更应该考虑原因。

20、不管一项研究是谁做的,它都需要通过常识性检验,而且需要通过没有被数据挖掘所污染的无偏数据的检验。



【相关阅读】

统计学教你识破一本正经的胡说八道


    本站仅按申请收录文章,版权归原作者所有
    如若侵权,请联系本站删除
    觉得不错,分享给更多人看到
    逍影成长利器 热门文章:

    寻找背后的真相 | 思考模型    阅读/点赞 : 44/5

    读书 | 成也习惯,败也习惯    阅读/点赞 : 31/6

    读书 | 大尺度的历史    阅读/点赞 : 23/6

    走到终点,成为那2%的人    阅读/点赞 : 23/5

    工具 | 高效行动的三个方法    阅读/点赞 : 22/7

    答读者问 | 挤不出时间怎么办    阅读/点赞 : 20/8

    未来未定犹可追 | 未来简史3    阅读/点赞 : 20/5

    答读者问 | 爱上学习,再谈长期    阅读/点赞 : 11/5