资源加载中... loading...

风险小史(五) 贝叶斯,一个只活在教材里的男人

Author: 发明者量化-小小梦, Created: 2017-01-03 13:22:05, Updated: 2017-01-04 10:18:42

【风险小史】(五)贝叶斯,一个只活在教材里的男人

**  生前籍籍无名的贝叶斯的工作一方面继续证明了“不确定性是可以测量”的这一个激动人心的理念,另一方面也提供给我们依据客观世界的经验去推断未知概率的方法,而这样的推断是基于我们得到的信息不断修正的结果。。。。。。。。。。【风险小史】系列文章由公众号(有金有险,betalpha2015)原创提供。如需转载,请获得原作者授权。**

**  像托马斯·贝叶斯这样在整个科学史上鼎鼎大名的人物,居然没有什么可供书写的个人生活故事,是一件非常奇怪的事情。这一方面说明贝叶斯生前的确非常低调(或者说,就是不红),另一方面,给我这样的写作者带来了非常大的不方便,因为其实大家都喜欢看科学家的奇闻轶事,比如不善交际的同时狂妄自大,比如玩物丧志的间歇一鸣惊人,再不济也可以是身染花柳却对研究矢志不渝,不然完全不能体现天才的独特性。** img

  • △托马斯·贝叶斯 然而贝叶斯就是这么一个无聊的人。他是一个住在英国乡下的非主流教派牧师,平日里的工作大概就是组织全村一起广场舞,不对,弥撒,据说全村因此都很热爱他。唯一看上去有一点传奇色彩的是,他像很多传奇一样,活着的时候也没有出版过一本书。当然大多数不是传奇的人也是这样。另外,贝叶斯决定投身概率论研究的原因在于想要证明上帝的存在,但是从最后的研究结果和影响来看,不知道教会的人会不会觉得他是个内奸。

    贝叶斯去世的时候把他的论文手稿外加100英镑留给了一个叫普林斯的传教士。要说这个普林斯也是一朵奇男子,精神文明和物质文明建设比贝叶斯不知道高到哪里去了。他觉得自由意志是神授的,还写过论文证明美国独立也是上帝的意志,据说富兰克林和亚当斯密都是他的好朋友,另外他还在业余时间帮保险公司做费率模型,可谓涉猎甚广。

    在贝叶斯去世三年后,普林斯帮他把遗作论文发了出来。但是这篇论文的划时代意义被学界正视,又等了二十年。在论文里,贝叶斯打算研究的是这样一个问题:如果我们只知道一个事件发生的次数和没有发生的次数,在没有其他信息的情况下,我们应该怎么计算这个事件发生的概率?

    我们回忆一下上一篇(风险小史(四):棣莫弗与神之曲线)的例子。比如对于一批产品,我们抽取10000个产品后发现其中有12个废品,那么对于这一批产品而言,废品率是0.1%的概率有多大呢?对于现实生活而言,这个问题无疑对于我们更有价值,因为每个人对事物的观察总有局限,我们需要知道我们看到的东西能够多大程度地反映真相,就好像我们如果我们去摸象,如何确定自己到底摸的是整个象、象腿还是旁边比较胖的大兄弟。

    贝叶斯采用的方法,实际上是用新的信息不断修正旧的信息,在修正的基础上增加概率的可信度。这就是传说中的先验概率和后验概率。对这个问题,贝叶斯在论文里举了一个经典的例子:

    img

    假如我们在台球桌上打出一个球,球停在任意的地方。然后,我们反复打出了另一个球,分别计算它滚到第一个球左边和右边的次数。当然这里你可以合理提出质疑,就是既然我们去打台球,为什么不用第二个球去打第一个球,我觉得你这个问题问得很好,但我就是不想回答。总之我们可以通过第二个球出现在左边和右边的次数,直接推断出第一个球的停留位置的概率。

    在这个例子里,对第一个台球停留位置直接给出的概率就是先验概率,而根据第二个球的情况所推断出来的对第一个球停留位置修正的概率,则是后验概率。也就是说贝叶斯的方法是,我们的认知受到我们认知能力的局限,因此我们需要不断用更新的信息来修正我们的观点。而上升到哲学高度,就是世界的本源或许不具备随机性,但是我们的能力并不足以让我们认知到这样的本源,所以我们只能靠已有的证据去估计,或者说,去猜。

    上面这句话大概是连载至今最为装逼的一段。我们来假设一个例子帮助理解:

    思聪在你们城里开了两个mall,新mall的人流量占总人流量的60%,那么此时任意一名顾客对思聪而言,都有60%的概率是新mall的顾客。这个就是先验概率。而旧mall设施陈旧疏于管理,员工也缺乏培训水平比较低,收到的投诉率比新mall高两倍。此时如果有一个人给思聪发微信投诉,思聪应该找哪个mall的经理来负责任?

    img

    最简洁明了的答案是思聪直接问这个人到底是在哪儿。当然那个人很可能会回答说你猜猜(太贱了),那么思聪应该怎么猜才会有更大的正确几率呢?如果从先验概率来看,那么思聪应该找新mall的经理,因为新mall的人流量比旧mall大。但是从投诉来看,新mall的投诉量只占总投诉量的1/3,那么如果我们参考这个信息,就会发现,新mall发生投诉的概率是42.8%而旧mall发生投诉的概率是57.2%。这个结果,也就是后验概率,告诉我们思聪应该找的是旧mall的经理。

    生前籍籍无名的贝叶斯现在出现在几乎所有的统计学、人工智能、博弈论、遗传学的教材之中,让众多大学期末考试的考生平生无数烦恼。他的工作一方面继续证明了“不确定性是可以测量”的这一个激动人心的理念,另一方面也提供给我们依据客观世界的经验去推断未知概率的方法,而这样的推断是基于我们得到的信息不断修正的结果。这个思路与我们风险管理的目标与实践不谋而合:在一个动态变化的市场里,如果存在不确定性,那么任何结果和决策都依赖于我们对最新和最全面信息的梳理,并且这样的梳理同样是没有止境的。

转载自 中国量化投资学会


More