01.jpg

关于概率,你的直觉不总是可靠

赛先生 2017-06-02

  “我们的大脑生来就不太会搞概率,所以这么多人弄错也正常。”

  撰文 秦芊(佛罗里达大学统计系)

  编辑 丁家琦

  概率作为对可能性大小的度量,似乎充满了主观色彩。明天下雨的可能性有多高?曼联夺得下届英超冠军的概率有多大?在一盘棋中AlphaGo的获胜概率是多少?我们身边的每个人对这样的问题都有着不同的答案。

  然而,概率似乎又有它自己的铁律。在帕斯卡等人最初用二项式定理研究赌桌上的胜率时,人们已经意识到在骰子和轮盘看似不可预知的行为背后,藏着一套可以被掌握的数学规律。一意孤行或者是听天由命,违背这套规律的赌徒可能在一两个晚上大获全胜,却最终一定会受到概率的惩罚。随着人类数学与计算水平的提高,概率论被应用到越来越多的领域之中。在金融、统计、物理、气象、生物等诸多学科,那些依靠直觉而不是计算对可能性进行推断的日子已经一去不复返了。在本文中,我们介绍几个概率谜题。它们向我们展示了,对于概率,直觉并不总是可靠——但经过足够的思考和踏实的实验与计算,我们常常能够战胜错觉,抵达真相。

  三门问题

  上世纪五十到八十年代,科普作家马丁·加德纳(Martin Gardner)为《科学美国人》撰写了近300期的“数学游戏”专栏。在其中一期专栏中[1],加德纳描述了一个名为“三囚犯”的概率问题。这个问题的一个变种后来成为了网络上最著名的概率趣题之一。这一变种(Monty Hall 三门问题)的描述如下:

  假设你参与一个综艺节目,并被要求从三扇门中选择一扇打开:一扇门的背后是奖品(一辆汽车),另外两扇门后则各是一只山羊。当然,比起山羊,你更希望抽中汽车。你随机选择了一扇门(不妨设为第一扇)。节目的主持人知道每扇门背后是什么。看到你的选择后,他选择了剩下两扇门中没有奖品的一扇打开(如果两扇门后都没有奖品,则以各50%的概率随机选择其中一扇)。不妨假设他打开了第三扇。接着他问你,你想改选第二扇门吗?为了提高获奖概率,你有必要改变你之前的选择吗?

(图片来源:作者绘制)

  这一问题的正确答案是,你应当改选第二扇门——这样做让你的中奖概率从1/3提高到了2/3。1990年,当这个问题——以及它的正确答案——在美国畅销杂志《Parade》的一个专栏上重新出现时,近万名读者,包括“近千名博士”[2],写信给专栏作者玛丽莲·沃斯·莎凡特(Marilyn vos Savant),其中绝大部分反对这一答案。人们似乎认为,主持人打开第三扇门后,第一扇门和第二扇门后藏有奖品的概率都是1/2,因此改选第二扇门并无好处。面对滔天的反对声,玛丽莲据理力争,拒不认输,连写三篇专栏解释自己的答案。她同时在专栏上实名公布了不少读者来信。一些反对的声音摘抄如下[3]。

  “你错了。但看看好的一面:假如那么多博士们都说错了,那这个国家就麻烦了。”

  “我相信你一定收到了很多来自高中生和大学生的来信。或许你应该记下几个来信地址,好在将来专栏出问题时请教他们。”

  “我希望这次的争议能够让公众意识到我们国家的教育危机……到底还需要多少个盛怒的数学家才能改变你的想法?”

  “或许女人看待数学问题的方式和男人不一样。”

  “你就是那只山羊!”

  玛丽莲笑到了最后[4]。她倡议全美国的数学课堂用纸杯和硬币模拟三门问题,并获得了中小学老师们的支持:毫无疑问,改选第二扇门将获奖概率提升了一倍。在正确答案终于被确认无误后,有人提出了一些简单的、基于直觉的推理来方便人们理解,但这些推理往往又在对题目稍加改变后失效[4]。时至今日,学者们仍然对人们给出错误答案的原因津津乐道。这一看上去很简单的趣题,却从各方面给了人们十足的挑战。

  现在给出这个问题的一种解法:我们将计算出,在主持人打开第二扇门后,奖品藏在第三扇门后的概率是2/3。

  考虑我们的节目参与者(前文中的“你”)在选择了第一扇门后、主持人打开第三扇门之前面对的情形。她可以想象自己等可能地处在许多个(比如说600个)“平行世界”中的一个。在其中1/3的,即200个世界里,奖品藏在第一扇门后。我们把这些世界标记为1到200号。类似的,在201到400号世界里,奖品藏在第二扇门后;在401到600号世界里,奖品藏在第三扇门后。

  现在,主持人打开了第三扇门。参赛者便意识到,有一些平行世界被“筛选”了出来。 具体地说,在第1到200号世界中,第二与第三扇门后都没有奖品,主持人随机选择其中一扇门打开。在这200个世界中,第三扇门在一半的世界中被打开——我们不妨假设它们为第101至第200号世界。在201到400号世界里,由于奖品在第二扇门背后,主持人总是选择第三扇门打开。而在401到600号世界里,由于奖品本就在第三扇门背后,主持人不可能打开第三扇门——一旦参赛者看到第三扇门被打开,她就能确定自己必定不处在这200个世界之中。

  综合来考虑,我们发现在第三扇门打开后,参赛者等可能地存在于第101号到400号世界之中。在其他的300个世界中,第三扇门都没有被打开,因此她必不处在其中任何一个。现在,我们只需要数数在第三扇门被打开的300个世界中,有多少个的奖品藏在第二扇门中。显然,这样的世界有200个(201号到400号)。因此改选第二扇门获奖的概率为200/300=2/3。

  表格1 各种情况发生的世界。因为主持人打开了第三扇门,参与者只可能处在101-400号(黄色)的世界中。括号中的数字为各种情况在所有世界中所占的比例。

奖品位置

主持人打开的门

世界编号

第一扇门

(1/3)

第二扇门

(1/3×1/2)

1-100

 (1/6)

第三扇门

(1/3×1/2)

101-200 

 (1/6)

第二扇门

(1/3)

第三扇门

(1/3)

201-400

 (1/3)

第三扇门 

(1/3)

第二扇门 

(1/3)

401-600 

 (1/3)

  

  在上述的推导中,101号到400号平行世界被概率学家们称作“样本空间”。它是在我们计算概率时所有可能性的总体。在这个问题中,它包含了所有“第三扇门被主持人打开”的可能情况。我们所计算的概率,则被称为在“第三扇门被主持人打开”的情况下,“奖品在第二扇门后”的“条件概率”。可以说,在古典概率论中,除了语焉不详的表述外,没有什么比条件概率更容易产生违反直觉的结论了。

  癌症筛查结果呈阳性,先别慌?

  下面这道教材中经典的题目[5],就是条件概率在实际生活中冲击直觉的另一个例证。

  在一次例行体检中,一位女性接受了乳腺癌的X光检测。根据以往经验,在与该受检者年龄、家庭病史、体态等指标类似的女性群体中,乳腺癌的发病率大约是1%。检测结果呈阳性。当然,由于误差的存在,阳性并不意味着受检者必然患病。通过查阅文献,医生得知对乳腺癌患者,该检测正确地得到阳性结果的概率为79.2%;而对非乳腺癌患者,该检测错误地得到阳性结果的概率只有9.6%。假设这两个概率与受检者的年龄、家庭病史、体态等其他指标基本无关。请问该受检女性患乳腺癌的概率有多大?

  在一项针对内科医生的调查中,大约95%的受访者认为该女性的患病概率在75%上下[6]。然而正确答案却出乎意料——只有不到8%。

  表格2 各个情况的世界数目及比例。由于结果呈阳性,我们必处于被标记为黄色的792+9504个世界中。

是否患乳腺癌

检测结果

世界数目(比例)

(1%)

阳性 

(1%×79.2%)

792 

 (0.00792)

阴性 

(1%×20.8%)

208  

(0.00208)

(99%)

阳性

(99%×9.6%)

9504 

(0.09504)

阴性 

(99%×90.4%)

89496  

(0.89496)

  

  让我们站在问题里医生的角度考虑这一问题。首先,我们需要确定所处的样本空间。再次假想在许多个(比方说,10万个)平行世界中,这位女性受检者接受了X光检测。在头1%,即1000个世界中,该女性患有乳腺癌;在其他99%,即99000个世界中她则没有患病。在头1000个世界里,有79.2%,即792个世界中的检测结果呈阳性;在另外99%的世界中,有99000×9.6%=9504个世界中的结果呈阳性。既然我们观测到的检测结果为阳性,我们的样本空间即是792+9504=10296个结果呈阳性的世界。在这约一万个世界中,受检女性在792个里确实患病。因此,该女性的患病概率是792/10296=7.69%。这比调查中大多数医生的估计要低出许多。这是因为他们并没有充分地将乳腺癌的低发病率(1%)纳入考虑。

  当然,随着医学的发展,如今很多疾病筛查的假阳性概率可以控制到很低,所以,如果检测到阳性结果也不要麻痹大意,一定要以医生的判断为准。

  为什么你的朋友比你更受欢迎?

  1991年,根据上世纪60年代初在12个高中采集的学生社交数据,Scott Feld发表了一篇名为“为什么你的朋友们比你有更多朋友”的论文[6]。作者证明了在几乎所有的社交网络中,平均上来讲,人们的朋友数目要低于他们的朋友的朋友数目(见图1)。在人们发现这个悲伤的事实后,相关的研究一发不可收拾,有的研究还提出了一些更强的结论。比如说,对于大多数人来说,他(她)的大多数朋友要比他(她)有更多的朋友。这个结论比Feld提出的平均意义上的结论要更强,也不总是成立,但在理论和实证上都有证据支持[7]。有趣的是,人们似乎对此毫不自知,甚至倾向于认为相比于自己的朋友们,自己拥有的朋友数目更多[8]。所有类似于“你的朋友们比你有更多朋友”的结论因此被通称为“友谊悖论”。

  图1. Feld所研究的一个社交网络。网络中的每个节点代表一名学生。如果两个学生是朋友,则她们的节点由一条边连接。 每个节点所拥有的边的数目即是该学生的朋友数。学生名字下方的括号中记录了她的朋友们的朋友数的均值和中位数。有5名学生(Betty, Jane, Pam, Dale和Tina)的朋友数比自己朋友的平均朋友数要低;而只有2名学生(Sue和Alice)的朋友数比自己朋友的平均朋友数要高。

  我们现在尝试用之前讲到的条件概率粗略地说明为什么我们的朋友可能比我们更善于交友。假设小明交朋友的能力在人群中处于中游——大约有50%的人比他更善于交朋友,另外50%的人交友能力比他差。小华是小明的朋友。那么,小华的交友能力更可能比小明强还是弱呢?用条件概率的语言来说,我们希望得到在“小华是小明的朋友”的情况下,“小华强于小明”的条件概率——特别地,既然小明的交友能力处在人群中游,这一概率是否仍是1/2?

  表格3 列出了小明与小华交友的各种情况。既然小华与小明是朋友,样本空间由黄色标记的情况构成。

  我们再次想象许多个等可能的平行世界,每个世界中有一个小华的“副本”。因为小明的交友能力处于人群的中游,所以在其中一半的世界中,小华强于小明;在另一半世界里,小华弱于小明。我们用下述公式表达这些世界中小华的交友能力:

  头一半世界中的小华>小明>后一半世界中的小华

  既然小明的交友能力已经给定,两人的交友概率与小华的交友能力正相关。因此,比起后一半世界,在头一半世界中有更多的小华副本同小明交友,即(见表格3):

  小华强于小明且两人交友的世界数(a)>小华弱于小明且两人交友的世界数(b)

  我们已知小明和小华成了朋友。因此,我们的样本空间是所有小明与小华交友的世界。所求的概率便是样本空间中小华强于小明的世界的比例,即

  由于a>b,上述比例必然大于1/2。也就是说,在小明与小华是朋友的条件下,小华强于小明的概率大于1/2,即小华更有可能比小明更擅长交友。那么,小华比小明有更多朋友也就不足为奇了。

  上面简易的推导当然不能直接得出“你的朋友们比你有更多朋友”。取决于我们如何诠释这一命题,友谊悖论的严格证明可难可易。英文问答网站Quora上有一篇关于友谊悖论的研究现状的精彩综述[9]。

  在评论三门问题时,斯坦福大学的概率和统计学家Persi Diaconis这么说道[2] :“我不太记得我的第一反应是什么了……但我知道对于许多类似的问题,我的第一反应是错的。” Diaconis同时是名职业魔术师。谙熟幻术的他这样总结:“我们的大脑生来就不太会搞概率,所以这么多人弄错也正常。”

  幸运的是,像三门问题这样的幻术在人们反复的讨论中不断地被破解,甚至理解。与这样的讨论相伴的,是人们——从学者到大众——对概率的更为深入的了解。在给玛丽莲的信件中,一名小学老师说道:“我们的班级,以高涨的热情,骄傲地宣布数据支持你的立场。”无论是通过计算、模拟,还是实验,人类拥有超越自身直觉的手段。

  参考文献

  [2] Tierney, John (21 July 1991). "Behind Monty Hall's Doors: Puzzle, Debate and Answer?". The New York Times

  [3] vos Savant, Marilyn (1990 to 1991). "Ask Marilyn". Parade Magazine. URL: http://marilynvossavant.com/game-show-problem/

  [4] Rosenthal, Jeffrey S. "Monty hall, Monty fall, Monty crawl." Math Horizons 16.1 (2008): 5-7.

  [5] Eddy, David M. "Probabilistic reasoning in clinical medicine: Problems and opportunities." (1982).

  [6] Feld, Scott L. "Why your friends have more friends than you do." American Journal of Sociology 96.6 (1991): 1464-1477.

  [7] Lattanzi, Silvio, and Yaron Singer. "The power of random neighbors in social networks." Proceedings of the Eighth ACM International Conference on Web Search and Data Mining. ACM, 2015.

  [8] Zuckerman, Ezra W., and John T. Jost. "What makes you think you're so popular? Self-evaluation maintenance and the subjective side of the" friendship paradox"." Social Psychology Quarterly (2001): 207-223.

  [9] https://www.quora.com/Is-the-friendship-paradox-fallacious

责任编辑:xujinghui

科普中国APP 科普中国微信 科普中国微博
赛先生
是中国科协为深入推进科普信息化建设而塑造的全新品牌,旨在以科普内容建设为重点,充分依托现有的传播渠道和平台,使科普信息化建设与传统科普深度融合,以公众关注度作为项目精准评估的标准,提升国家科普公共服务水平。

猜你喜欢