04 | 独立性:随机事件的相互关系
你好,欢迎来到我的概率论课,我是刘嘉。
了解了概率论中随机和概率这两个基石之后,这一讲,我们学习概率论的第三个基石性概念——独立性。
这个概念很重要,因为它描述的是随机事件之间的相互关系。只有明白了一个随机事件和其他随机事件的关系,判断它们之间是否具有独立性,才能正确分析和度量它的概率。
随机事件的两种关系
什么是“独立性”呢?
通俗地讲,如果随机事件之间没有任何关联,我们就可以说这些随机事件是相互独立的,它们之间就具备独立性。而这种具备独立性的随机事件,也被称为“独立事件”。
好像有点儿抽象,举个例子你就明白了。
比如,今天晚上你想吃火锅,可是你女朋友想减肥,她提议吃蔬菜沙拉,然后你们抛硬币决定,正面就吃火锅,反面就吃沙拉。第一次,你抛了正面,你女朋友说没开始呢,让你再抛;第二次,你又抛了正面,你女朋友说这只是试试,不算。
也许是冥冥之中火锅店老板庇佑,你连续抛了5次都是正面。你女朋友惊呆了,她说,最后一次,再抛个正面我们就去吃火锅,如果是反面,你还得陪我吃沙拉。
问题来了,今天晚上你们到底更可能吃火锅呢?还是更可能吃沙拉呢?也就是问,第6次抛硬币,结果是正面的概率是多少呢?
你可能觉得,都连着扔了5次正面了,这一次硬币出现正面的概率肯定更小,出现反面的概率更大了。这个判断对吗?不对。这就是我们常听到的“赌徒谬误”。
当然,你也可能会逆向思维,知道既然前5次都是正面,下一次很可能继续是正面。这个判断对不对呢?抱歉,也不对,这就犯了另一个错误,叫“热手谬误”。
概率更大也不对、更小也不对,那正确答案是什么呢?我来告诉你吧——第6次抛硬币,结果是正面的概率还是1/2。
第6次抛硬币跟前面几次抛硬币是相互独立的,不管前5次结果怎样,第6次出现正面的概率都还是1/2。这一次抛硬币的结果,不会影响下一次的结果。这就是独立性。抛硬币是一个典型的独立事件。
两个随机事件相互独立,在概率论中说的就是,一个随机事件的发生,不影响另一个随机事件发生的概率。也就是说,下一个随机事件发生的可能性,不会被上一个随机事件所影响。这就是随机事件之间的独立性。而如果两个随机事件之间有影响,那它们之间就是非独立的。
要么具有独立性,要么具有非独立性,概率论研究的所有对象——随机事件之间,只有这两种关系。
独立性的重要意义
到这里你可能会问,知道独立性的定义干嘛?辨别随机事件的独立性有什么意义吗?
为了说明独立性的作用,我们再举个例子。我和我女儿猜拳,前面的课程里说过,我女儿是一个非常差的随机制造者,我发现她每次出石头之后,下一次一定出布。她以为自己每次出拳都是随机的,而我早就发现了这个规律,并且总是靠这个规律赢她。
这个规律代表什么呢?其实,用概率论的语言表达就是——我女儿上一次出拳的结果,影响了下一次出拳。当她上一次出了石头,下一次出拳就不再是石头、剪刀、布各1/3的概率了,而是变成了出布的概率是100%。你看,两次出拳并不具备独立性,而是相互联系、互相影响的。
这种会产生相互影响的随机事件,也叫“非独立事件”。因为我女儿前后两次猜拳之间相互影响的规律被我发现了,我就可以通过猜拳使唤她做很多事情。
你看,原本互相独立的事件,当你发现它们之间有关系的时候,对概率的估计、决策的方式都会发生很大的改变。
换个角度,我女儿有没有什么对付我的办法呢?如果恰好学习了这一讲,她就会知道,最简单的方法就是打破自己出拳的规律,让每次出拳的结果不会相互影响。这样她每次出拳的结果又是独立事件了,我就拿她没办法了。
当然,我希望她不要那么快想到这个办法。
事件的独立性本质上是一个数学概念
听起来挺简单的,但是在现实中,我们真能这么轻松的辨别独立事件吗?事实上,识别随机事件的独立性是非常困难的。
给你说个故事,真事儿。2013年,英国德比郡一个叫约翰的人,在超市买了一小盒鸡蛋,共6个。磕开第1个,约翰惊喜地发现这是一个双黄蛋。这是他有生以来第一次碰到双黄蛋。接着他又磕开了第2个,又是双黄蛋。更神奇的是,约翰接下来又连续磕开3个,都是双黄蛋。他欣喜若狂,一不小心把最后一个鸡蛋摔在了地上。见证奇迹的时候到了,这还是一个双黄蛋。
约翰一下买到6个双黄蛋的奇闻,被媒体争相报道。英国有机构的数据显示:母鸡平均每下1000个鸡蛋,才会出现1个双黄蛋,也就是说,双黄蛋的概率是1/1000。那么,一盒里6个都是双黄蛋的概率是多少呢?
如果我们假设,盒子里这个鸡蛋是双黄蛋和那个鸡蛋是双黄蛋,是完全的独立事件,两者毫无关系。那么连续6个都是双黄蛋的概率,就是每个鸡蛋是双黄蛋的概率的乘积,就是1/1000的六次方,也就是10的18次方分之一。
10的18次方分之一意味着什么呢?假如你每秒磕开6个鸡蛋,现在让你每秒6个、每秒6个的磕,要磕多久才能保证,在某一秒里6个鸡蛋都是双黄蛋的情况,至少出现一次呢?大约317亿年。要知道,宇宙从大爆炸到现在也就是138亿年。这个时间是宇宙年龄的两倍多。
你说,这是多么罕见的事情啊。那这个约翰是不是史上最幸运的人呢?还真不是。因为约翰并不是宇宙诞生以来连续磕出6个双黄蛋的第一人。就在3年前,在英国另一个地方,还发生过一次几乎一模一样的事情。
按说,理论计算不应该和事实有如此大的差别。这不禁让我们困惑,问题出在哪儿呢?会不会是这么计算有问题呢?
还记得这种计算方式的前提吗?对,就是我们一开始的那个假设——同一个盒子里,这个鸡蛋是双黄蛋,和另一个鸡蛋是双黄蛋,是独立事件。也许这个假设是错的。
首先就有专家提出质疑,母鸡下双黄蛋的概率受自身年龄的影响。越年轻的母鸡,下双黄蛋的概率越大。一只刚开始下蛋的母鸡,下双黄蛋的概率要远远高于1/1000。而在现代化的农场里,母鸡是分批次养殖的。同一批母鸡,会在相同的时间长大、开始产蛋。所以如果恰好买到这批年轻母鸡下的蛋,出现双黄蛋的概率就要大得多。
另一方面,我们都知道,鸡蛋大小不同,往往售价不同。所以无论是工作人员,还是自动化机器,在分拣包装鸡蛋时,往往会区分大小,把大个儿的放在一个盒子里。这样,只要盒子里第一个放进去的是大个儿的鸡蛋,后面几个也放大个儿鸡蛋的概率就会大大增加。而双黄蛋普遍比一般鸡蛋个头大,在芸芸众蛋中十分显眼,所以被捡到一个盒子里的概率就会大幅度提升。
你看,很多我们以为的独立事件,也许并不具有独立性。像这个鸡蛋是双黄蛋和那个鸡蛋是双黄蛋,这样两个看起来毫不相关的事件,都因为鸡蛋个头的大小,被扯上了千丝万缕的联系。
现在你明白了吗?独立事件,只是我们描述某些随机事件的数学模型罢了。
这种数学模型,可能真的是因为这些随机事件之间没有关系,不互相影响;也可能是因为一些随机事件存在内在联系,但我们并不知道;还有一种可能就是,假设这些随机事件之间相互独立,可以简化我们对概率的计算。
但不管怎样,在现实生活中,判断随机事件是否独立时要格外小心。很多情况下,如果错把互相影响的事件当成了独立事件,就会得出离真相很远的答案。
回到最开始男女朋友抛硬币决定吃火锅还是沙拉的例子。如果男朋友抛了100次都是正面,你觉得下一次会是正面还是反面呢?概率还都是1/2吗?
不。这时候,你就不应该还假设两次抛硬币是互不影响的独立事件了,而是要检查男朋友抛的那个硬币是不是有问题。
划重点
1. 如果一个随机事件发生的结果,不会影响另一个随机事件的概率,那它们就是互相独立的事件,反之就是非独立事件。
2. 只有明白了随机事件之间的关系,判断它们是否具有独立性,才能正确分析和度量它的概率。
3. 很多看似独立的事件,其实都是互有联系、互相影响的。评估随机事件的概率时,对独立事件的设定需要格外谨慎。
最后,给你留一道思考题:
现实生活中,你还能找到貌似是相互独立的事件,其实是相互影响、相互联系的吗?
欢迎在留言区写下你的答案。
-- END --
*文章为作者独立观点,不代表知识管理平台立场。