逻辑学简短入门(牛津通识读本)
  • 重译说明
  • 前言
  • 第1章:有效性:从什么可以推出什么?
  • 第2章(上):真值函数——亦或不是?
  • 第2章(下)真值函数——亦或不是?
  • 第3章:名称与量词:空无一物是某物吗?
  • 第4章(上):摹状词与存在:古希腊人崇拜宙斯吗?
  • 第4章(下):摹状词与存在:古希腊人崇拜宙斯吗?
  • 第5章:自指:本章是关于什么的?
  • 第6章:必然与可能:什么会是一定如此的?
  • 第7章:条件句:“如果”中有什么?
  • 第8章:将来和过去:时间是真实的吗?
  • 第9章:同一性与变化:有什么是一成不变的吗?
  • 第10章:模糊性:如何在滑坡上停止下滑?
  • 第11章:概率:缺少参照类的奇怪情形
  • 第12章:互逆概率:你无法忽略其差别!
  • 第13章:决策论:远大期望
  • 第14章:停!发生什么了?
  • 第15章:也许为真——但你无法证明!
  • 第16章:一点历史与进阶阅读
  • 术语表
  • 习题
  • 参考文献
  • 附录:习题解答
由 GitBook 提供支持
在本页

这有帮助吗?

第12章:互逆概率:你无法忽略其差别!

上一页第11章:概率:缺少参照类的奇怪情形下一页第13章:决策论:远大期望

最后更新于5年前

这有帮助吗?

前一章我们对概率及其在归纳推断中可能起到的作用,有了一个基本理解。本章我们将对之作进一步考察。作为开始,让我们考虑一个非常著名的归纳推断。

物理宇宙不是杂乱无章的。它表现出非常独特的模式:物质组织成星系,星系又组织成恒星和行星系统,在其中一些行星系统上,物质又按某种方式组织产生了像你我这样的生物。我们如何解释这一点呢?你可能会说,物理学和生物学提供了解释。但为什么物理学和生物学的定律是那样的呢?毕竟,它们也可以是完全不同的样子。比如,重力可以是一种排斥力,而不是吸引力。那样的话,就永远不会有稳定的物质块,我们所知的生命在宇宙任何地方都不可能存在。这难道没有给我们极好的理由让我们相信,存在一个宇宙的造物者吗?一个为了某种目的创造了宇宙以及物理学和生物学定律的智慧之物。

这个论证常被称作“由于设计的论证(Argument from Design)”(为了证明上帝存在)。也许更好的叫法是,为了设计的论证(Argument to Design),但这不重要。让我们更仔细地考虑一下这个论证。该论证的前提 ooo 大致是这样的陈述:宇宙以某种方式形成秩序。结论 ggg 断言,存在一个造物者上帝。除非 ggg 为真,否则 ooo 是极不可能的;因此,该论证进一步得到:既然有 ooo,ggg 是很可能的。

现在,显然为真的是,给定 ggg 为真的条件下 ooo 的条件概率远大于给定 ggg 不为真的条件下 ooo 的条件概率:

1. pr(o∣g)>pr(o∣¬g)1.\ pr(o|g) > pr(o|\neg g)1. pr(o∣g)>pr(o∣¬g)

但这并没有给出我们想要的。ooo 要成为 ggg 的一个好的归纳理由,我们需要的是:给定 ooo 的条件下 ggg 的条件概率大于其否定的条件概率:

2. pr(g∣o)>pr(¬g∣o)2.\ pr(g|o) > pr(\neg g|o)2. pr(g∣o)>pr(¬g∣o)

而 pr(o∣g)pr(o|g)pr(o∣g) 是高概率并不必然意味着 pr(g∣o)pr(g|o)pr(g∣o) 也是高概率。比如,给定你在野外看见袋鼠的条件下,你在澳大利亚的概率会很高。(任何其他地方,它只能是从动物园跑出来的。)但给定你在澳大利亚的条件下,你在野外看见袋鼠的概率却很低。(我在澳大利亚住了 10 年才看见一只。)

pr(o∣g)pr(o|g)pr(o∣g) 和 pr(g∣o)pr(g|o)pr(g∣o) 称为(互)逆概率(inverse probabilities)。我们已经看到的是,设计论证要成立的话,二者之间的关系必须能让我们从 111 得到 222。是否如此呢?事实上,互逆概率之间存在一个非常简单的关系。回想一下上一章的公式 CP\mathbf{CP}CP,根据定义:

pr(a∣b)=pr(a∧b)/pr(b)pr(a|b)=pr(a\land b)/pr(b)pr(a∣b)=pr(a∧b)/pr(b)

因此:

3. pr(a∣b)×pr(b)=pr(a∧b)3.\ pr(a|b)\times pr(b)=pr(a\land b)3. pr(a∣b)×pr(b)=pr(a∧b)

类似的:

pr(b∣a)=pr(b∧a)/pr(a)pr(b|a)=pr(b\land a)/pr(a)pr(b∣a)=pr(b∧a)/pr(a)

因此:

或者,变形得到:

于是我们看到,设计论证并不成立。它之所以有诱惑力,是因为人们混淆了概率和它的逆概率,因而略过了论证的关键部分。

R, R, R, R, B

无差别原则是对概率进行直觉推理的一个重要部分。但它并不是没有问题的,我们以指出其问题而结束本章。众所周知的是,它会在某些应用中导致悖论。这里便是一个。

假设一辆车在正午离开布里斯班,驶向 300 公里之外的某个城市。车以 50 至 100 公里每小时之间的某个恒定速度行驶。关于其到达时间的概率我们能说些什么呢?如果它以 100 公里每小时的速度行驶,那么它会在下午 3 点达到;如果它以 50 公里每小时的速度行驶,那么它会在下午 6 点到达。因此,它在这两个时刻之间到达。这两个时刻的中点是下午 4 点 30 分。那么根据无差别原则,这辆车在下午 4 点 30 分之前和之后到达的可能性一样大。但现在,50 公里每小时和 100 公里每小时之间的中点是 75 公里每小时。那么同样根据无差别原则,车以超过和低于 75 公里每小时行驶的可能性一样大。如果车以 75 公里每小时行驶,那么它会在下午 4 点到达。因此,在下午 4 点之前和之后到达的可能性一样大。特别的,在下午 4 点 30 分之前比之后到达的可能性要更大(因为多出半小时)。

我请读者自己思考这个例子。我们已经在一章之内讨论够多概率问题了。

本章要点

  • 给定若干可能性,若它们之间没有任何相关差别,则它们有相同的概率(无差别原则)。

4. pr(b∣a)×pr(a)=pr(b∧a)4.\ pr(b|a)\times pr(a)=pr(b\land a)4. pr(b∣a)×pr(a)=pr(b∧a)

但 pr(a∧b)=pr(b∧a)pr(a\land b)=pr(b\land a)pr(a∧b)=pr(b∧a)(因为 a∧ba\land ba∧b 和 b∧ab\land ab∧a 为真的情形完全一样)。这样,由 333 和 444 可得:

pr(a∣b)×pr(b)=pr(b∣a)×pr(a)pr(a|b)\times pr(b)=pr(b|a)\times pr(a)pr(a∣b)×pr(b)=pr(b∣a)×pr(a)

假定 pr(b)pr(b)pr(b) 不为 0——下面作这类假定时不再说明——我们可以将等式变形得到:

Inv: pr(a∣b)=pr(b∣a)×pr(a)/pr(b)\mathbf{Inv}:\ pr(a|b)=pr(b|a)\times pr(a)/pr(b)Inv: pr(a∣b)=pr(b∣a)×pr(a)/pr(b)

这就是互逆概率之间的关系。(要记住这个公式,注意到下面的顺序可能会有所帮助:等式右边先是 bbb,后面跟着 aaa,然后是 aaa,后面跟着 bbb。)

使用 Inv\mathbf{Inv}Inv 对 111 中的互逆概率进行改写得到:

pr(g∣o)×pr(o)pr(g)>pr(¬g∣o)×pr(o)pr(¬g)pr(g|o)\times\dfrac{pr(o)}{pr(g)} > pr(\neg g|o)\times\dfrac{pr(o)}{pr(\neg g)}pr(g∣o)×pr(g)pr(o)​>pr(¬g∣o)×pr(¬g)pr(o)​

两边消去 pr(o)pr(o)pr(o) 得到:

pr(g∣o)pr(g)>pr(¬g∣o)pr(¬g)\dfrac{pr(g|o)}{pr(g)} > \dfrac{pr(\neg g|o)}{pr(\neg g)}pr(g)pr(g∣o)​>pr(¬g)pr(¬g∣o)​

5. pr(g∣o)pr(¬g∣o)>pr(g)pr(¬g)5.\ \dfrac{pr(g|o)}{pr(\neg g|o)} > \dfrac{pr(g)}{pr(\neg g)}5. pr(¬g∣o)pr(g∣o)​>pr(¬g)pr(g)​

回想一下,设计论证要成立的话我们必须得到 222,而它等价于:

pr(g∣o)pr(¬g∣o)>1\dfrac{pr(g|o)}{pr(\neg g|o)} >1pr(¬g∣o)pr(g∣o)​>1

而要由 555 得到 222,合理的假设似乎只有 pr(g)pr(¬g)≥1\dfrac{pr(g)}{pr(\neg g)} \geq 1pr(¬g)pr(g)​≥1,即:

pr(g)≥pr(¬g)pr(g)\geq pr(\neg g)pr(g)≥pr(¬g)

pr(g)pr(g)pr(g) 和 pr(¬g)pr(\neg g)pr(¬g) 的值称作先验概率(prior probabilities),即,先于使用任何证据(比如 ooo)时 ggg 和 ¬g\neg g¬g 的概率。因此,要使得该论证通过的话,我们似乎需要的是,存在造物者上帝的先验概率大于(或等于)不存在的概率。

是否如此呢?不幸的是,没有理由认为是这样。事实上,情况似乎正好相反。假设你不知道今天星期几。令 mmm 为假设:今天星期一。那么 ¬m\neg m¬m 就是假设:今天不是星期一。哪一个更有可能呢?mmm 还是 ¬m\neg m¬m?当然是 ¬m\neg m¬m:因为比起今天是星期一,有更多的方式使得今天不是星期一。(今天可以是星期二,星期三,星期四……)关于上帝也是类似的。可以设想,宇宙可以有很多不同的方式。直觉上,其中有显著秩序的要相对少得多:秩序是某种特殊的东西。毕竟,这就是设计论证的前提。但这样一来,其中有秩序制定者(orderer)的可能宇宙也要相对少得多。由此推理可得,没有造物主的可能性比有造物主的可能性要大得多。

许多归纳论证要求我们对互逆概率进行推理。设计论证在这方面并不特殊。但许多论证在这方面做得更成功。让我举例说明。假设你去当地赌场。有两个轮盘赌的轮盘。称它们为 AAA 和 BBB。一个朋友告诉你,其中一个轮盘被做了手脚——不过朋友不能告诉你究竟是哪一个。一个公平的轮盘在一半时间停在红色,一半时间停在黑色,而被做过手脚的轮盘 3/4 的时间停在红色,1/4 的时间停在黑色。(严格说来,真实的轮盘还会偶尔停在绿色,但为了简单起见让我们忽略这一点。)现在,假设你观察其中一个轮盘,比方说 AAA,经过 5 次连续旋转后结果如下:

(R 表示红色,B 表示黑色)。你有理由推断这就是那个被做过手脚的轮盘吗?换言之,令 ccc 是大致这样的陈述:这个特定的序列出现,令 fff 为陈述:轮盘 AAA 被做过手脚,那么从 ccc 到 fff 的推断是个好的归纳推断吗?

我们需要知道 pr(f∣c)>pr(¬f∣c)pr(f|c) > pr(\neg f|c)pr(f∣c)>pr(¬f∣c) 是否成立。使用公式 Inv\mathbf{Inv}Inv 将其转换为逆概率之间的关系,我们得到:

pr(c∣f)×pr(f)pr(c)>pr(c∣¬f)×pr(¬f)pr(c)pr(c|f)\times\dfrac{pr(f)}{pr(c)} > pr(c|\neg f)\times\dfrac{pr(\neg f)}{pr(c)}pr(c∣f)×pr(c)pr(f)​>pr(c∣¬f)×pr(c)pr(¬f)​

两边同时乘以 pr(c)pr(c)pr(c) 得到:

pr(c∣f)×pr(f)>pr(c∣¬f)×pr(¬f)pr(c|f)\times pr(f) > pr(c|\neg f)\times pr(\neg f)pr(c∣f)×pr(f)>pr(c∣¬f)×pr(¬f)

它是否为真呢?首先,fff 和 ¬f\neg f¬f 的先验概率是多少呢?我们知道要么 AAA 要么 BBB 被做了手脚。我们没有更多的理由相信它就是 AAA 而不是 BBB,反过来也是如此。因此该轮盘是 AAA 的概率是 1/2,是 BBB 的概率也是 1/2。换言之,pr(f)=1/2pr(f)=1/2pr(f)=1/2 且 pr(¬f)=1/2pr(\neg f)=1/2pr(¬f)=1/2。因此,我们可以在上面的等式两边消去它们,得到:

pr(c∣f)>pr(c∣¬f)pr(c|f) > pr(c|\neg f)pr(c∣f)>pr(c∣¬f)

给定轮盘像上面描述的那样被做了手脚的条件下,观察到由 ccc 陈述的序列的概率 pr(c∣f)pr(c|f)pr(c∣f) 为:(3/4)4×(1/4)(3/4)^4\times(1/4)(3/4)4×(1/4)(如果你不知道为什么,不要紧,相信我的计算),也就是 81/4581/4^581/45,算出来等于 0.079。给定轮盘没有被做过手脚因而是公平的条件下,观察到该序列的概率 pr(c∣¬f)pr(c|\neg f)pr(c∣¬f) 为 (1/2)5(1/2)^5(1/2)5(同样,请相信我的计算),算出来等于 0.031,小于 0.079。因此,推断是有效的。

这里我们计算先验概率的方法值得注意。我们有两种可能性:要么轮盘 AAA 被做了手脚,要么轮盘 BBB 被做了手脚。而我们没有任何信息能区分这两种可能性。因此我们指派相同的概率给它们。这是一种被称作无差别原则(Principle of Indifference)的应用。该原则告诉我们,当我们有若干可能性,它们之间没有任何相关差别时,它们就有相同的概率。这样,如果总共有 NNN 个可能性,每一个的概率就是 1/N1/N1/N。无差别原则是一种对称性原理。

注意,我们不能在设计论证中应用无差别原则。在轮盘赌的例子中,有两个完全对称的可能情形:轮盘 AAA 被做了手脚,轮盘 BBB 被做了手脚。在设计论证中,有两个情形:造物者上帝存在,造物者上帝不存在。但这两个情形并不比今天是星期一和今天不是星期一更加对称。正如我们看到的,直觉上,没有造物主的可能性要远远大于有造物主的可能性。

pr(a∣b)=pr(b∣a)×pr(a)pr(b)pr(a|b)=pr(b|a)\times\dfrac{pr(a)}{pr(b)}pr(a∣b)=pr(b∣a)×pr(b)pr(a)​