A、B、C三道帘子,其中一道帘子后面有奖品。你选择了A,主持人打开B,B后没奖品。此时,给你一个改变选择的机会,你要改变选择吗?很多人会认为,A、C中奖概率一样,没必要改变选择。但贝叶斯会告诉你,应该换C,C的中奖概率比A大。
贝叶斯统计,一个极其有趣、极其深刻的方法论。
《统计学关我什么事》,作者: [日]小岛宽之,豆瓣8.1分。这书名相当误导人,任谁看,恐怕也不会想到这是一本专门将贝叶斯统计的书。书名误导人,这本书,是一本不错的贝叶斯统计入门书籍。
1
本书特点
本书前面近三分之二的内容,重点在介绍贝叶斯统计的核心概念,这部分内容中,没有出现一个概率符号,也没有出现一个复杂公式,用到的主要是面积图及简单的四则运算。例子相当通俗易懂,理解起来没有丝毫困难。
本书后面三分之一的内容,开始出现复杂的概率符号及公式,并且会使用贝塔分布、正太分布等进行高级推理。这一部分,需要一定的数学基础和耐心。看不懂后面这部分也没关系,弄懂前面的部分,基本就已经掌握贝叶斯统计的核心基础了。
总的来说,这书确实通俗易懂,而且通俗的有点过头——行文相当之啰嗦,将一个小学生水平的运算过程反复进行详细说明,而且通常是大段大段的重复说明。不过瑕不掩瑜,虽然啰嗦了点,但将问题讲清楚了就好。
2
有趣的贝叶斯
说回开头的那个例子,如果是你,你会改变选择吗?
三道帘子均未掀开时,选择A帘中奖汽车的概率是1/3。当主持人掀开B帘,并且明确B帘后没有汽车,此时主持人给你重选的机会,你是否会改选C呢?
很多人的第一印象是A、C中奖概率均变为1/2,所以没必要更换选择。而贝叶斯推理之后却告诉你,A的中奖概率仍为1/3,但C的中奖概率却提升为2/3,所以你应该果断改选C。
感兴趣的可以自行去查看本书的推理过程。或许你觉得不可思议,但,这确实就是结果。
行为改变,导致信息增加,从而切实改变了概率分布,这是贝叶斯推理最深刻的地方:它能通过不断搜集信息来进行学习改进!是不是像极了人类大脑的认知机制?
3
深刻的贝叶斯
以上的例子很有趣,但要用来说明贝叶斯的核心,还不够典型。以贝叶斯的典型应用垃圾邮件过滤器来说说贝叶斯统计的核心特点。
在收到一封邮件时,过滤器会默认将该邮件为垃圾邮件、正常邮件的先验概率设为0.5。也就是说,再掌握更多信息之前,该邮件为垃圾邮件的概率只有50%。
然后过滤器开始扫描右键内容,如果发现链接,垃圾邮件概率可能就变为75%;如果再发现关键词“免费”,垃圾邮件概率可能就变为95%……得到的信息越多,判断结果就会越准确。
贝叶斯推理有个核心特性:序贯理性。依次或同时使用多条信息,得到的结果是一致的。这意味着,今天得到了几条信息,用到推理中,得到一个结论;下个月又得到几条信息,接着用,贝叶斯会在上次的经验基础上整合新信息,进而改进结论。也就是说,贝叶斯方法是具有学习功能的,它可以保存经验,再根据新的信息修改认知,简直就是和人类的思考过程一样!
如今,贝叶斯已经被广泛应用到物理学、生态学、心理学、计算机等各个领域。例如仅在计算机领域,应用就多的去了:自然语言处理、人工智能、推荐系统、图像识别、垃圾邮件筛选等等。
然而,如此深刻又实用的贝叶斯统计,一度被“正统”统计学派猛烈抨击至消亡。
下一篇文章中,谈谈贝叶斯统计的发展史。