第12章:互逆概率:你无法忽略其差别!

前一章我们对概率及其在归纳推断中可能起到的作用,有了一个基本理解。本章我们将对之作进一步考察。作为开始,让我们考虑一个非常著名的归纳推断。

物理宇宙不是杂乱无章的。它表现出非常独特的模式:物质组织成星系,星系又组织成恒星和行星系统,在其中一些行星系统上,物质又按某种方式组织产生了像你我这样的生物。我们如何解释这一点呢?你可能会说,物理学和生物学提供了解释。但为什么物理学和生物学的定律是那样的呢?毕竟,它们也可以是完全不同的样子。比如,重力可以是一种排斥力,而不是吸引力。那样的话,就永远不会有稳定的物质块,我们所知的生命在宇宙任何地方都不可能存在。这难道没有给我们极好的理由让我们相信,存在一个宇宙的造物者吗?一个为了某种目的创造了宇宙以及物理学和生物学定律的智慧之物。

这个论证常被称作“由于设计的论证(Argument from Design)”(为了证明上帝存在)。也许更好的叫法是,为了设计的论证(Argument to Design),但这不重要。让我们更仔细地考虑一下这个论证。该论证的前提 oo 大致是这样的陈述:宇宙以某种方式形成秩序。结论 gg 断言,存在一个造物者上帝。除非 gg 为真,否则 oo 是极不可能的;因此,该论证进一步得到:既然有 oogg 是很可能的。

现在,显然为真的是,给定 gg 为真的条件下 oo 的条件概率远大于给定 gg 不为真的条件下 oo 的条件概率:

1. pr(og)>pr(o¬g)1.\ pr(o|g) > pr(o|\neg g)

但这并没有给出我们想要的。oo 要成为 gg 的一个好的归纳理由,我们需要的是:给定 oo 的条件下 gg 的条件概率大于其否定的条件概率:

2. pr(go)>pr(¬go)2.\ pr(g|o) > pr(\neg g|o)

pr(og)pr(o|g) 是高概率并不必然意味着 pr(go)pr(g|o) 也是高概率。比如,给定你在野外看见袋鼠的条件下,你在澳大利亚的概率会很高。(任何其他地方,它只能是从动物园跑出来的。)但给定你在澳大利亚的条件下,你在野外看见袋鼠的概率却很低。(我在澳大利亚住了 10 年才看见一只。)

pr(og)pr(o|g)pr(go)pr(g|o) 称为(互)逆概率inverse probabilities)。我们已经看到的是,设计论证要成立的话,二者之间的关系必须能让我们从 11 得到 22。是否如此呢?事实上,互逆概率之间存在一个非常简单的关系。回想一下上一章的公式 CP\mathbf{CP},根据定义:

pr(ab)=pr(ab)/pr(b)pr(a|b)=pr(a\land b)/pr(b)

因此:

3. pr(ab)×pr(b)=pr(ab)3.\ pr(a|b)\times pr(b)=pr(a\land b)

类似的:

pr(ba)=pr(ba)/pr(a)pr(b|a)=pr(b\land a)/pr(a)

因此:

4. pr(ba)×pr(a)=pr(ba)4.\ pr(b|a)\times pr(a)=pr(b\land a)

pr(ab)=pr(ba)pr(a\land b)=pr(b\land a)(因为 aba\land bbab\land a 为真的情形完全一样)。这样,由 3344 可得:

pr(ab)×pr(b)=pr(ba)×pr(a)pr(a|b)\times pr(b)=pr(b|a)\times pr(a)

假定 pr(b)pr(b) 不为 0——下面作这类假定时不再说明——我们可以将等式变形得到:

Inv: pr(ab)=pr(ba)×pr(a)/pr(b)\mathbf{Inv}:\ pr(a|b)=pr(b|a)\times pr(a)/pr(b)

这就是互逆概率之间的关系。(要记住这个公式,注意到下面的顺序可能会有所帮助:等式右边先是 bb,后面跟着 aa,然后是 aa,后面跟着 bb。)

使用 Inv\mathbf{Inv}11 中的互逆概率进行改写得到:

pr(go)×pr(o)pr(g)>pr(¬go)×pr(o)pr(¬g)pr(g|o)\times\dfrac{pr(o)}{pr(g)} > pr(\neg g|o)\times\dfrac{pr(o)}{pr(\neg g)}

两边消去 pr(o)pr(o) 得到:

pr(go)pr(g)>pr(¬go)pr(¬g)\dfrac{pr(g|o)}{pr(g)} > \dfrac{pr(\neg g|o)}{pr(\neg g)}

或者,变形得到:

5. pr(go)pr(¬go)>pr(g)pr(¬g)5.\ \dfrac{pr(g|o)}{pr(\neg g|o)} > \dfrac{pr(g)}{pr(\neg g)}

回想一下,设计论证要成立的话我们必须得到 22,而它等价于:

pr(go)pr(¬go)>1\dfrac{pr(g|o)}{pr(\neg g|o)} >1

而要由 55 得到 22,合理的假设似乎只有 pr(g)pr(¬g)1\dfrac{pr(g)}{pr(\neg g)} \geq 1,即:

pr(g)pr(¬g)pr(g)\geq pr(\neg g)

pr(g)pr(g)pr(¬g)pr(\neg g) 的值称作先验概率prior probabilities),即,先于使用任何证据(比如 oo)时 gg¬g\neg g 的概率。因此,要使得该论证通过的话,我们似乎需要的是,存在造物者上帝的先验概率大于(或等于)不存在的概率。

是否如此呢?不幸的是,没有理由认为是这样。事实上,情况似乎正好相反。假设你不知道今天星期几。令 mm 为假设:今天星期一。那么 ¬m\neg m 就是假设:今天不是星期一。哪一个更有可能呢?mm 还是 ¬m\neg m?当然是 ¬m\neg m:因为比起今天是星期一,有更多的方式使得今天不是星期一。(今天可以是星期二,星期三,星期四……)关于上帝也是类似的。可以设想,宇宙可以有很多不同的方式。直觉上,其中有显著秩序的要相对少得多:秩序是某种特殊的东西。毕竟,这就是设计论证的前提。但这样一来,其中有秩序制定者orderer)的可能宇宙也要相对少得多。由此推理可得,没有造物主的可能性比有造物主的可能性要大得多。

于是我们看到,设计论证并不成立。它之所以有诱惑力,是因为人们混淆了概率和它的逆概率,因而略过了论证的关键部分。

许多归纳论证要求我们对互逆概率进行推理。设计论证在这方面并不特殊。但许多论证在这方面做得更成功。让我举例说明。假设你去当地赌场。有两个轮盘赌的轮盘。称它们为 AABB。一个朋友告诉你,其中一个轮盘被做了手脚——不过朋友不能告诉你究竟是哪一个。一个公平的轮盘在一半时间停在红色,一半时间停在黑色,而被做过手脚的轮盘 3/4 的时间停在红色,1/4 的时间停在黑色。(严格说来,真实的轮盘还会偶尔停在绿色,但为了简单起见让我们忽略这一点。)现在,假设你观察其中一个轮盘,比方说 AA,经过 5 次连续旋转后结果如下:

R, R, R, R, B

(R 表示红色,B 表示黑色)。你有理由推断这就是那个被做过手脚的轮盘吗?换言之,令 cc 是大致这样的陈述:这个特定的序列出现,令 ff 为陈述:轮盘 AA 被做过手脚,那么从 ccff 的推断是个好的归纳推断吗?

我们需要知道 pr(fc)>pr(¬fc)pr(f|c) > pr(\neg f|c) 是否成立。使用公式 Inv\mathbf{Inv} 将其转换为逆概率之间的关系,我们得到:

pr(cf)×pr(f)pr(c)>pr(c¬f)×pr(¬f)pr(c)pr(c|f)\times\dfrac{pr(f)}{pr(c)} > pr(c|\neg f)\times\dfrac{pr(\neg f)}{pr(c)}

两边同时乘以 pr(c)pr(c) 得到:

pr(cf)×pr(f)>pr(c¬f)×pr(¬f)pr(c|f)\times pr(f) > pr(c|\neg f)\times pr(\neg f)

它是否为真呢?首先,ff¬f\neg f 的先验概率是多少呢?我们知道要么 AA 要么 BB 被做了手脚。我们没有更多的理由相信它就是 AA 而不是 BB,反过来也是如此。因此该轮盘是 AA 的概率是 1/2,是 BB 的概率也是 1/2。换言之,pr(f)=1/2pr(f)=1/2pr(¬f)=1/2pr(\neg f)=1/2。因此,我们可以在上面的等式两边消去它们,得到:

pr(cf)>pr(c¬f)pr(c|f) > pr(c|\neg f)

给定轮盘像上面描述的那样被做了手脚的条件下,观察到由 cc 陈述的序列的概率 pr(cf)pr(c|f) 为:(3/4)4×(1/4)(3/4)^4\times(1/4)(如果你不知道为什么,不要紧,相信我的计算),也就是 81/4581/4^5,算出来等于 0.079。给定轮盘没有被做过手脚因而是公平的条件下,观察到该序列的概率 pr(c¬f)pr(c|\neg f)(1/2)5(1/2)^5(同样,请相信我的计算),算出来等于 0.031,小于 0.079。因此,推断是有效的。

这里我们计算先验概率的方法值得注意。我们有两种可能性:要么轮盘 AA 被做了手脚,要么轮盘 BB 被做了手脚。而我们没有任何信息能区分这两种可能性。因此我们指派相同的概率给它们。这是一种被称作无差别原则Principle of Indifference)的应用。该原则告诉我们,当我们有若干可能性,它们之间没有任何相关差别时,它们就有相同的概率。这样,如果总共有 NN 个可能性,每一个的概率就是 1/N1/N。无差别原则是一种对称性原理。

注意,我们不能在设计论证中应用无差别原则。在轮盘赌的例子中,有两个完全对称的可能情形:轮盘 AA 被做了手脚,轮盘 BB 被做了手脚。在设计论证中,有两个情形:造物者上帝存在,造物者上帝不存在。但这两个情形并不比今天是星期一和今天不是星期一更加对称。正如我们看到的,直觉上,没有造物主的可能性要远远大于有造物主的可能性。

无差别原则是对概率进行直觉推理的一个重要部分。但它并不是没有问题的,我们以指出其问题而结束本章。众所周知的是,它会在某些应用中导致悖论。这里便是一个。

假设一辆车在正午离开布里斯班,驶向 300 公里之外的某个城市。车以 50 至 100 公里每小时之间的某个恒定速度行驶。关于其到达时间的概率我们能说些什么呢?如果它以 100 公里每小时的速度行驶,那么它会在下午 3 点达到;如果它以 50 公里每小时的速度行驶,那么它会在下午 6 点到达。因此,它在这两个时刻之间到达。这两个时刻的中点是下午 4 点 30 分。那么根据无差别原则,这辆车在下午 4 点 30 分之前和之后到达的可能性一样大。但现在,50 公里每小时和 100 公里每小时之间的中点是 75 公里每小时。那么同样根据无差别原则,车以超过和低于 75 公里每小时行驶的可能性一样大。如果车以 75 公里每小时行驶,那么它会在下午 4 点到达。因此,在下午 4 点之前和之后到达的可能性一样大。特别的,在下午 4 点 30 分之前比之后到达的可能性要更(因为出半小时)。

我请读者自己思考这个例子。我们已经在一章之内讨论够多概率问题了。

本章要点

  • pr(ab)=pr(ba)×pr(a)pr(b)pr(a|b)=pr(b|a)\times\dfrac{pr(a)}{pr(b)}

  • 给定若干可能性,若它们之间没有任何相关差别,则它们有相同的概率(无差别原则)。

最后更新于