第12章：互逆概率：你无法忽略其差别！

前一章我们对概率及其在归纳推断中可能起到的作用，有了一个基本理解。本章我们将对之作进一步考察。作为开始，让我们考虑一个非常著名的归纳推断。

物理宇宙不是杂乱无章的。它表现出非常独特的模式：物质组织成星系，星系又组织成恒星和行星系统，在其中一些行星系统上，物质又按某种方式组织产生了像你我这样的生物。我们如何解释这一点呢？你可能会说，物理学和生物学提供了解释。但为什么物理学和生物学的定律是那样的呢？毕竟，它们也可以是完全不同的样子。比如，重力可以是一种排斥力，而不是吸引力。那样的话，就永远不会有稳定的物质块，我们所知的生命在宇宙任何地方都不可能存在。这难道没有给我们极好的理由让我们相信，存在一个宇宙的造物者吗？一个为了某种目的创造了宇宙以及物理学和生物学定律的智慧之物。

这个论证常被称作“由于设计的论证（Argument from Design）”（为了证明上帝存在）。也许更好的叫法是，为了设计的论证（Argument to Design），但这不重要。让我们更仔细地考虑一下这个论证。该论证的前提 $o$ 大致是这样的陈述：宇宙以某种方式形成秩序。结论 $g$ 断言，存在一个造物者上帝。除非 $g$ 为真，否则 $o$ 是极不可能的；因此，该论证进一步得到：既然有 $o$ ， $g$ 是很可能的。

现在，显然为真的是，给定 $g$ 为真的条件下 $o$ 的条件概率远大于给定 $g$ 不为真的条件下 $o$ 的条件概率：

$1.\ pr(o|g) > pr(o|\neg g)$

但这并没有给出我们想要的。 $o$ 要成为 $g$ 的一个好的归纳理由，我们需要的是：给定 $o$ 的条件下 $g$ 的条件概率大于其否定的条件概率：

$2.\ pr(g|o) > pr(\neg g|o)$

而 $pr(o|g)$ 是高概率并不必然意味着 $pr(g|o)$ 也是高概率。比如，给定你在野外看见袋鼠的条件下，你在澳大利亚的概率会很高。（任何其他地方，它只能是从动物园跑出来的。）但给定你在澳大利亚的条件下，你在野外看见袋鼠的概率却很低。（我在澳大利亚住了 10 年才看见一只。）

$pr(o|g)$ 和 $pr(g|o)$ 称为（互）逆概率（inverse probabilities）。我们已经看到的是，设计论证要成立的话，二者之间的关系必须能让我们从 $1$ 得到 $2$ 。是否如此呢？事实上，互逆概率之间存在一个非常简单的关系。回想一下上一章的公式 $\mathbf{CP}$ ，根据定义：

pr(a|b)=pr(a\land b)/pr(b)

因此：

$3.\ pr(a|b)\times pr(b)=pr(a\land b)$

类似的：

pr(b|a)=pr(b\land a)/pr(a)

因此：

$4.\ pr(b|a)\times pr(a)=pr(b\land a)$

但 $pr(a\land b)=pr(b\land a)$ （因为 $a\land b$ 和 $b\land a$ 为真的情形完全一样）。这样，由 $3$ 和 $4$ 可得：

pr(a|b)\times pr(b)=pr(b|a)\times pr(a)

假定 $pr(b)$ 不为 0——下面作这类假定时不再说明——我们可以将等式变形得到：

$\mathbf{Inv}:\ pr(a|b)=pr(b|a)\times pr(a)/pr(b)$

这就是互逆概率之间的关系。（要记住这个公式，注意到下面的顺序可能会有所帮助：等式右边先是 $b$ ，后面跟着 $a$ ，然后是 $a$ ，后面跟着 $b$ 。）

使用 $\mathbf{Inv}$ 对 $1$ 中的互逆概率进行改写得到：

pr(g|o)\times\dfrac{pr(o)}{pr(g)} > pr(\neg g|o)\times\dfrac{pr(o)}{pr(\neg g)}

两边消去 $pr(o)$ 得到：

\dfrac{pr(g|o)}{pr(g)} > \dfrac{pr(\neg g|o)}{pr(\neg g)}

或者，变形得到：

$5.\ \dfrac{pr(g|o)}{pr(\neg g|o)} > \dfrac{pr(g)}{pr(\neg g)}$

回想一下，设计论证要成立的话我们必须得到 $2$ ，而它等价于：

\dfrac{pr(g|o)}{pr(\neg g|o)} >1

而要由 $5$ 得到 $2$ ，合理的假设似乎只有 $\dfrac{pr(g)}{pr(\neg g)} \geq 1$ ，即：

pr(g)\geq pr(\neg g)

$pr(g)$ 和 $pr(\neg g)$ 的值称作先验概率（prior probabilities），即，先于使用任何证据（比如 $o$ ）时 $g$ 和 $\neg g$ 的概率。因此，要使得该论证通过的话，我们似乎需要的是，存在造物者上帝的先验概率大于（或等于）不存在的概率。

是否如此呢？不幸的是，没有理由认为是这样。事实上，情况似乎正好相反。假设你不知道今天星期几。令 $m$ 为假设：今天星期一。那么 $\neg m$ 就是假设：今天不是星期一。哪一个更有可能呢？ $m$ 还是 $\neg m$ ？当然是 $\neg m$ ：因为比起今天是星期一，有更多的方式使得今天不是星期一。（今天可以是星期二，星期三，星期四……）关于上帝也是类似的。可以设想，宇宙可以有很多不同的方式。直觉上，其中有显著秩序的要相对少得多：秩序是某种特殊的东西。毕竟，这就是设计论证的前提。但这样一来，其中有秩序制定者（orderer）的可能宇宙也要相对少得多。由此推理可得，没有造物主的可能性比有造物主的可能性要大得多。

于是我们看到，设计论证并不成立。它之所以有诱惑力，是因为人们混淆了概率和它的逆概率，因而略过了论证的关键部分。

许多归纳论证要求我们对互逆概率进行推理。设计论证在这方面并不特殊。但许多论证在这方面做得更成功。让我举例说明。假设你去当地赌场。有两个轮盘赌的轮盘。称它们为 $A$ 和 $B$ 。一个朋友告诉你，其中一个轮盘被做了手脚——不过朋友不能告诉你究竟是哪一个。一个公平的轮盘在一半时间停在红色，一半时间停在黑色，而被做过手脚的轮盘 3/4 的时间停在红色，1/4 的时间停在黑色。（严格说来，真实的轮盘还会偶尔停在绿色，但为了简单起见让我们忽略这一点。）现在，假设你观察其中一个轮盘，比方说 $A$ ，经过 5 次连续旋转后结果如下：

R, R, R, R, B

（R 表示红色，B 表示黑色）。你有理由推断这就是那个被做过手脚的轮盘吗？换言之，令 $c$ 是大致这样的陈述：这个特定的序列出现，令 $f$ 为陈述：轮盘 $A$ 被做过手脚，那么从 $c$ 到 $f$ 的推断是个好的归纳推断吗？

我们需要知道 $pr(f|c) > pr(\neg f|c)$ 是否成立。使用公式 $\mathbf{Inv}$ 将其转换为逆概率之间的关系，我们得到：

pr(c|f)\times\dfrac{pr(f)}{pr(c)} > pr(c|\neg f)\times\dfrac{pr(\neg f)}{pr(c)}

两边同时乘以 $pr(c)$ 得到：

pr(c|f)\times pr(f) > pr(c|\neg f)\times pr(\neg f)

它是否为真呢？首先， $f$ 和 $\neg f$ 的先验概率是多少呢？我们知道要么 $A$ 要么 $B$ 被做了手脚。我们没有更多的理由相信它就是 $A$ 而不是 $B$ ，反过来也是如此。因此该轮盘是 $A$ 的概率是 1/2，是 $B$ 的概率也是 1/2。换言之， $pr(f)=1/2$ 且 $pr(\neg f)=1/2$ 。因此，我们可以在上面的等式两边消去它们，得到：

pr(c|f) > pr(c|\neg f)

给定轮盘像上面描述的那样被做了手脚的条件下，观察到由 $c$ 陈述的序列的概率 $pr(c|f)$ 为： $(3/4)^4\times(1/4)$ （如果你不知道为什么，不要紧，相信我的计算），也就是 $81/4^5$ ，算出来等于 0.079。给定轮盘没有被做过手脚因而是公平的条件下，观察到该序列的概率 $pr(c|\neg f)$ 为 $(1/2)^5$ （同样，请相信我的计算），算出来等于 0.031，小于 0.079。因此，推断是有效的。

这里我们计算先验概率的方法值得注意。我们有两种可能性：要么轮盘 $A$ 被做了手脚，要么轮盘 $B$ 被做了手脚。而我们没有任何信息能区分这两种可能性。因此我们指派相同的概率给它们。这是一种被称作无差别原则（Principle of Indifference）的应用。该原则告诉我们，当我们有若干可能性，它们之间没有任何相关差别时，它们就有相同的概率。这样，如果总共有 $N$ 个可能性，每一个的概率就是 $1/N$ 。无差别原则是一种对称性原理。

注意，我们不能在设计论证中应用无差别原则。在轮盘赌的例子中，有两个完全对称的可能情形：轮盘 $A$ 被做了手脚，轮盘 $B$ 被做了手脚。在设计论证中，有两个情形：造物者上帝存在，造物者上帝不存在。但这两个情形并不比今天是星期一和今天不是星期一更加对称。正如我们看到的，直觉上，没有造物主的可能性要远远大于有造物主的可能性。

无差别原则是对概率进行直觉推理的一个重要部分。但它并不是没有问题的，我们以指出其问题而结束本章。众所周知的是，它会在某些应用中导致悖论。这里便是一个。

假设一辆车在正午离开布里斯班，驶向 300 公里之外的某个城市。车以 50 至 100 公里每小时之间的某个恒定速度行驶。关于其到达时间的概率我们能说些什么呢？如果它以 100 公里每小时的速度行驶，那么它会在下午 3 点达到；如果它以 50 公里每小时的速度行驶，那么它会在下午 6 点到达。因此，它在这两个时刻之间到达。这两个时刻的中点是下午 4 点 30 分。那么根据无差别原则，这辆车在下午 4 点 30 分之前和之后到达的可能性一样大。但现在，50 公里每小时和 100 公里每小时之间的中点是 75 公里每小时。那么同样根据无差别原则，车以超过和低于 75 公里每小时行驶的可能性一样大。如果车以 75 公里每小时行驶，那么它会在下午 4 点到达。因此，在下午 4 点之前和之后到达的可能性一样大。特别的，在下午 4 点 30 分之前比之后到达的可能性要更大（因为多出半小时）。

我请读者自己思考这个例子。我们已经在一章之内讨论够多概率问题了。

本章要点
$pr(a|b)=pr(b|a)\times\dfrac{pr(a)}{pr(b)}$
给定若干可能性，若它们之间没有任何相关差别，则它们有相同的概率（无差别原则）。

上一页第11章：概率：缺少参照类的奇怪情形下一页第13章：决策论：远大期望

最后更新于5年前