作者 | 刘嘉
你好,欢迎来到我的概率论课。我是刘嘉。
前面四讲,我们学习了概率论这座大厦的四块基石,也明白了概率论解决问题的核心思路——把局部的随机性转化为整体上的确定性。要实现这个转化,靠的是什么呢?当然就是“概率”。当一件事的概率确定了,它在整体上发生的可能性就确定了。
这一讲,我们就来看看整体的确定性是如何建立的。换句话说,我们是如何度量概率的呢?
简单来说,常用的度量概率的方法有三种——定义法、频率法、迭代法。
为什么会有三种方法呢?一种方法难道不好吗?其实,这三种方法是伴随着概率论的发展逐步出现的。最开始是定义法,后来又出现了频率法和迭代法。除了定义法现在用得比较少了之外,频率法和迭代法到现在还在大量使用。
学习了这一讲,你不仅能了解概率论的发展脉络,还会更深入地理解概率论“把局部的随机性,转化为整体上的确定性”这个解决问题的核心思路。下面我们一个一个说。
1.定义法
听名字就知道,定义法就是直接定义,直接认为某件事不同结果出现的可能性是相等的,没有任何一个结果比其他结果更有可能发生。
比如定义法认为,抛硬币正面朝上和反面朝上的概率相等,都是50%;一个标准的骰子,抛出每个点数的概率也相等,都是1/6。这些概率,都是我们直接定义的。
现实生活中,我们也经常这样设定。比如,选择题4选1,我们认为随便选一个,蒙对的概率是1/4。这里就有一个人为的设定,就是认为“每个选项正确的概率都是一样的”。再比如,我要去跑马拉松,要么坚持下来到达终点,要么中途放弃。跑之前,我说跑完或者放弃的可能性“一半对一半”,这也是一种等可能性的设定。
你可能会说,怎么能随便定义呢?这不靠谱吧?
确实,从现在的视角来看,定义法是有很多不靠谱的地方。这是概率论这个学科刚刚起步的时候,我们对概率的认知局限所导致的。你可能听过“古典概率”这个说法,古典概率就是这样一种等可能性的概率定义法。
不过我想说的是,虽然定义法简单粗暴,但是在宏观尺度上,它是一种对现实世界的合理简化,还是有一定科学性的。
你看,我们用定义法确定抛硬币、掷骰子的概率,几百年了,还是挺准的。全是蒙对的吗?当然不是。定义法这种等概率假设,是基于宏观世界的对称性这个大前提的。
对称性,是世界的普遍规律。雪花是对称的,花瓣是对称的,单摆小球的轨迹是对称的,连行星运行的轨迹很多也是对称的,甚至在微观粒子运动和相互作用中,也会体现对称性。对称,是自然最完美的展现。
一枚理想的硬币,在几何形状上是对称的,密度是均匀的。当硬币抛起来的时候,作用于硬币上的力也是对称的,重力、摩擦力、大气压力等都是对称的……所以我们当然就假设,硬币正反面出现的概率也是对称的,一半一半,各50%。你看,用定义法进行等概率假设,是不是有一定的科学性?
那我为什么又说这是合理的简化呢?
刚才说了,影响硬币在空中的状态的因素太多了。硬币的密度、形状、出手的角度、空气的密度、当时的风向等,都有影响,完全搞清楚是非常困难的。但是一方面,可能这些因素的影响很小;另一方面,各个因素的影响又会互相抵消。所以我们就全部忽略这些,把它简化成没有其他因素影响的理想状态。这不就是一个合理的简化吗?
连著名的经济学家凯恩斯在他的《概率论》一书中,都专门给这种定义法取了个名字,叫“无差别原理”。也就是说,如果没有充分理由说明某件事的概率,就给予每个结果相同的概率。这个原理在科学、统计学、经济学、哲学、心理学中的应用,持续了很长时间。
2.频率法
虽然定义法好用,但随着概率论要处理的事情越来越多,慢慢的我们就发现,在很多事情上,多个结果出现的概率是不相等的。比如,一个人患肺癌的概率、一批产品的次品率、我们考试通过的概率……即便不知道到底是多少,我们也知道,假设概率“一半对一半”是很荒谬的。怎么办呢?
随着数学家对概率研究的深入,我们就有了第二种度量概率的方法——频率法。
频率法就是说,只要数据量足够大,一个随机事件发生的频率就会无限接近它发生的概率。换句话说,虽然每次结果都是随机的,但随着这件事重复的做,只要重复足够多次,隐含的规律就会慢慢浮现出来。
拿掷骰子来说吧,现实中我们当然没法找到一个数学意义上六个面完全均匀的骰子,所以严格的说,它各个点数出现的概率肯定就不相等。这时候,定义法就失效了。怎么办?
用频率法。我们可以反复掷骰子,比如掷1000次,点数6出现的次数达到了500次,也就是说,点数6出现的概率大约是1/2。这和定义法的1/6差得实在太远,所以我们就能做出推测——这个骰子很可能被做过手脚。
现实的概率度量也是类似。比如投篮命中的概率、肺癌患病的概率等,只要找到足够多的数据,我们用投篮命中的数量除以总投篮的次数,用患肺癌的人数除以样本的总人数,计算出来的频率,我们就认为它大概就是这件事发生的概率。
这种依靠大量数据获得真相的思路,是现代统计学的基础,广泛地应用在各个学科之中。这个我们会在第二模块、第三模块详细讲到。
3.迭代法
有频率法就行了吗?不行。当我们用概率解决生活问题的时候,发现还是有些事情解决不了。
首先,有些事是没法试的。
比如,美国说要在2050年登上火星,你觉得概率有多大?这可没法反复做试验。再比如,你向某个女生表白,成功的概率有多大?也不能表白个500次,计算一下成功的次数吧?
其次,很多事不断发展,它的概率是不断变化的。
比如费德勒和纳达尔的比赛,费德勒获胜的概率有多大呢?随着比赛的进行,场上局势的变化,这个概率也是不断变化的。
而且,很多问题还和个体的差异有关。
比如同样一道4选1的选择题,不同人答对的概率是一样的吗?当然不是。有些人只能靠蒙,可能他答对的概率就是1/4;而他隔壁桌的那个学霸,答对的概率可能是99%,甚至是100%。
类似的问题还有很多。或者是数据量不足,或者是概率本身不断变化,或者是和个体密切相关,这些事情的概率都没有办法通过反复试验、收集数据来预测。怎么办?
想办法解决问题嘛。于是,数学家很快就有了第三种概率度量的方式——迭代法。
迭代法就是说,先利用手头少量的数据做推测,甚至是主观猜测一件事儿的概率,然后再通过收集来的新数据,不断调整对这件事概率的估算。最常用的方法就叫作“贝叶斯”。
有了迭代法,刚才说的没法解决的问题,概率就都可以度量了。比如,虽然没法通过反复试验判断美国2050年登上火星的概率,但是我可以先给一个假设,比如就是定义法中的1/2吧。然后,我不断收集新的数据和证据,比如美国登陆火星的计划的公开、核心技术的发展状况、美国太空总署的经费变化、火星登陆的新闻报道等,来调整之前的预测。
这种不断迭代和调整的方法,就是我们说的迭代法。具体的内容,我们会在课程的第四模块详细讲到。
不同概率度量方式的关系
讲完了概率度量的三种方法,你会发现,它们其实是从不同的视角来度量概率的——
定义法,是通过自然世界的对称性来定义概率;
频率法,是用随机事件发生的频率来计算概率;
而迭代法,是用一种动态发展的、考虑个人差异的角度来度量概率。
通过对这三种方法的学习,你应该也能看出来,跟所有的科学研究一样,人们对概率的研究也是不断深入的。
不过要提醒你的一点是,这三种方法并不是泾渭分明的,它们经常融合着使用。频率法可以验证定义法的正确性;迭代法也可以用定义法或者频率法来获得最初的判断;频率法和迭代法,又可以同时使用,相互验证。
打个比方来说,这三种方法,就好比工具箱里的三把尺子,共同对概率进行度量。这也是概率论和很多学科不一样的地方。它不是新方法推翻旧方法,而是一种方法为另一种方法提供其他维度的辅助。
划重点
1.定义法是一种等概率的设定,来源于自然界对称性的假设,是一种宏观尺度下的合理简化。
2.频率法是通过随机事件发生的频率来估算概率,要求试验或数据尽可能的多。
3.迭代法强调不断迭代,可以在小规模数据下,针对事件的变化和个体的差异度量概率。
4.三种方法并不是泾渭分明,而是常常融合使用,一起更清晰和全面地认识这个世界。
最后,给你留一道思考题:
你还能举出身边的例子来告诉我,哪些情况下是用定义法定义概率,哪些情况下我们常常使用频率法和迭代法吗?
欢迎在评论区写下你的想法。