第13章:决策论:远大期望

让我们看一下关于归纳推理的一个最后问题。这个主题有时也称作实践推理practial reasoning),因为它是对人们应该如何行动进行推理。下面是一条著名的实践推理。

你可以选择相信(一个基督教的)上帝存在,也可以选择不相信。让我们假设你选择相信。上帝要么存在要么不存在。如果上帝存在,一切好说。如果不存在,那么你的信念会带来小小的不便:它意味着你要浪费一点时间在教堂里,也许还要做少量其他你本来不想做的事;但这些都不是灾难性的。另一方面,现在假设你选择不相信上帝存在。同样,上帝要么存在要么不存在。如果上帝不存在,一切好说。但如果上帝真的存在,老兄你就有麻烦了!你死后会遭受很多痛苦;如果得不到一点宽恕的话,也许会永世不得翻身。因此,任何明智之人都应该选择相信上帝存在。这是唯一谨慎的选择。

这个论证现在通常称作帕斯卡赌注Pascal's Wager),以首次提出它的 17 世纪哲学家布莱斯·帕斯卡命名。关于这个赌注有什么要说的呢?

让我们稍微思考一下这类推理是如何进行的。我们先从一个不那么有争议的例子开始。当我们实施行动时,我们往往不确定最后的结果,它们可能不完全受我们的控制。但我们通常能估计各种结果的可能性有多大;同样重要的是,我们能估计各种结果对我们的价值有多大。按照惯例,我们可以通过对每个结果在下面的范围指派一个数字来度量其价值,这个范围在两个方向上都是无限的:

,4,3,1,0,+1,+2,+3,+4,\ldots,-4,-3,-1,0,+1,+2,+3,+4,\ldots

正数是好的,越往右越好。负数是差的,越往左越差。00 是无差别点:做不做都行。

现在,假设有一个我们可能会实施的行动,比方说去骑自行车。然而,天也许会下雨。不下雨的时候骑自行车会很有乐趣,因此我们会赋予它一个值,比方说 +10+10。但下雨时骑自行车就很悲催,因此我们会赋予它一个值,比方说 5-5。对我们唯一能控制的事情——去骑自行车,我们应该赋什么值呢?我们可以只是把两个数字 5-51010 加在一起,但那样就漏掉了这个情景中的一个重要部分。也许下雨的可能性非常低,因此尽管可能下雨是不好的,我们也不希望给它太多权重。假设下雨的概率是,比方说 0.10.1;相应的,不下雨的概率就是 0.90.9。那么我们可以用相应的概率对值进行加权,得到总的值为:

0.10×(5)+0.9×100.10\times(-5)+0.9\times 10

它等于 8.58.5,我们把它称作上述行动——去骑自行车的期望值expectation)。(这里的“期望”是一个专业术语,它和我们日常使用这个词的意义实际上没有什么关系。)

一般地,令 aa 表示:我们实施某个行动。简单起见,假设只有两个可能的结果。令 o1o_1 表示其中一个结果出现,令 o2o_2 表示另一个结果出现。最后,令 V(o)V(o) 表示 oo 为真时我们赋予它的价值。那么 aa 的期望值 E(a)E(a) 就是如下定义的数:

pr(o1)×V(o1)+pr(o2)×V(o2)pr(o_1)\times V(o_1)+pr(o_2)\times V(o_2)

(严格说来,上述概率应该分别为条件概率 pr(o1a)pr(o_1|a)pr(o2a)pr(o_2|a)。但在这个例子中,出去骑自行车对下雨的概率没有影响。我们要考察的所有其他例子也都是如此。因此我们这里可以一直使用简单的先验概率。)

目前为止都没问题。但这如何帮助我们决定是否要去骑自行车呢?我们知道去骑单车的总体价值。正如我们已经看到的,其期望值为 8.58.5。不去骑自行车的期望值是多少呢?同样,要么下雨要么不下雨——概率和前面一样。现在的两个结果是:(i) 下雨我待在家里;(ii) 不下雨我待在家里。两种情况我都得不到骑自行车的乐趣。如果不下雨的话,情况可能或略遭一点。在那种情况下,我可能会对没有去骑自行车而感到懊恼。但两种情况都不会比淋成落汤鸡更糟。因此,如果下雨,价值可能为 00,不下雨,价值可能为 1-1。现在就可以计算待在家里的期望值了:

0.10×0+0.9×(1)0.10\times 0+0.9\times(-1)

结果为 0.9-0.9,这给了我们需要的信息;因为我应该选择具有最高总体价值(即期望值)的行动。在这个例子里,去骑自行车的期望值为 8.58.5,而待在家里的期望值为 0.9-0.9。因此,我应该去骑自行车。

这样,给定 aa¬a\neg a 之间的选择,我应该选择那个期望值更大的。(如果二者有相同的期望值,我随机选一个就行,比方说,通过掷硬币。)在前面的例子中,只有两种可能性。一般情况下,可能有更多可能性(比如,去骑自行车,去看电影和待在家里)。不过原理是一样的:计算每个可能性的期望值,然后选择期望值最大的那个。这种推理是来自逻辑学的一个分支——决策论decision theory)的简单例子。

现在让我们回到帕斯卡赌注。在这个例子里,有两个可能的行动:相信或不相信;有两个相关可能性:上帝存在或上帝不存在。我们可以用下表来表示相关信息:

上帝存在

上帝不存在

我相信(bb

0.1\+1020.1\backslash+10^2

0.9\100.9\backslash -10

我不相信(¬b\neg b

0.1\1060.1\backslash -10^6

0.9\+1020.9\backslash +10^2

反斜杠左边的数字是相关概率,比如,0.10.1 是上帝存在的概率,0.90.9 是上帝不存在的概率。(我是否相信上帝对上帝是否存在没有影响,因此两行的概率一样。)反斜杠右边的数字是相关价值。我不太关心上帝是否存在;重要的是我没有弄错;因此我没有弄错的这两种情况价值都是 +102+10^2。(也许人们在这里的偏好并不完全一样,但我们会看到,这无关紧要。)上帝不存在时相信它存在,会有一点不便,因此价值为 10-10。不过,上帝存在却不相信它存在,那就真的糟糕了,因此价值为 106-10^6

给定这些值,我们可以算出相关的期望值:

E(b)=0.1×102+0.9×(10)0E(¬b)=0.1×(106)+0.9×102105\begin{aligned} E(b) & =0.1\times 10^2 +0.9\times(-10)\simeq 0\\ E(\neg b) & =0.1\times(-10^6)+0.9\times 10^2\simeq -10^5 \end{aligned}

\simeq 意思是“约等于”。)我应该选择期望值更大的行动,即相信上帝存在。

你可能会认为,我选取的那些精确数值有点任意;它们的确如此。但事实上,那些精确数值具体是多少并没有多大关系。重要的是 106-10^6 这个值。这个数字表示事情真的很糟糕。(有时,决策论专家会把它写作 -\infty。)它是如此糟糕,以至于淹没了所有其他的数字,即使上帝存在的概率很低。这就是帕斯卡赌注有冲击力的地方。

这个赌注或许看上去相当有说服力,但事实上,它犯了一个十分简单的决策论错误。它忽略了一些相关的可能性。不是只有一个可能的神,而是有很多:基督教的神(上帝),伊斯兰教的真主阿拉,印度教的婆罗门,还有更多各种小宗教所崇拜的神。如果上帝存在而你不相信它,你会有麻烦;但如果阿拉存在而你不相信它,也会有同样的麻烦,如此等等。此外,如果上帝存在,你却信仰阿拉,或者反过来,阿拉存在而你信仰上帝,那么情况会更糟。因为无论是在基督教还是在伊斯兰教中,信仰错误的神比做简单的无信仰者要还要糟。我们画出具有更现实信息的表格如下:

没有神存在

上帝存在

阿拉存在

\cdots

无信仰(nn

0.9\+1020.9\backslash +10^2

0.01\1060.01\backslash-10^6

0.01\1060.01\backslash -10^6

\cdots

信仰上帝(gg

0.9\100.9\backslash -10

0.01\+1020.01\backslash +10^2

0.01\1090.01\backslash -10^9

\cdots

信仰阿拉(aa

0.9\100.9\backslash -10

0.01\1090.01\backslash-10^9

0.01\+1020.01\backslash+10^2

\cdots

\vdots

\vdots

\vdots

\vdots

如果我们根据这些即使有限的信息来计算期望值,我们会得到:

E(n)=0.9×102+0.01×(106)+0.01×(106)2×104E(g)=0.9×(10)+0.01×102+0.01×(109)107E(a)=0.9×(10)+0.01×(109)+0.01×102107\begin{aligned} E(n) & =0.9\times 10^2 + 0.01\times(-10^6) + 0.01\times(-10^6)\simeq 2\times 10^4\\ E(g) & =0.9\times(-10)+0.01\times 10^2 +0.01\times(-10^9)\simeq -10^7\\ E(a) & = 0.9\times(-10) + 0.01\times(-10^9) + 0.01\times 10^2\simeq -10^7 \end{aligned}

情况看上去都很惨淡。但很清楚的是,信仰有神论的结果会更加糟糕。你不应信仰它们中的任何一个。

和其他章一样,让我以如下方式结束本章。我会给出一些理由,说明人们为什么会担心这里给出的一般框架——具体到这里就是,根据最大期望值进行决策的策略。

假设你在帕斯卡赌注中下错了注,最后进了地狱。几天后,魔鬼带着一笔交易出现。上帝已发号施令,说你可以得到某种宽恕。因此魔鬼谋划了一个方案。他会给你一个逃出地狱的机会。你可以掷硬币,如果正面朝上,你就可以出地狱、升天堂。如果反面朝上,你就要永远待在地狱。然而,硬币并不是公平的,魔鬼可以控制胜算。如果你今天掷硬币,正面朝上的机会是 1/21/2(即,11/21-1/2)。如果你等到明天掷硬币,机会就上升到 3/43/4(即,11/221-1/2^2)。你把信息总结如下:

逃离地狱

待在地狱

今天掷硬币(dd

0.5\+1060.5\backslash+10^6

0.5\1060.5\backslash-10^6

明天掷硬币(mm

0.75\+1060.75\backslash+10^6

0.25\1060.25\backslash-10^6

逃离地狱有一个很大的正值,待在地狱有一个很大的负值。并且,这些值在今天和明天是一样的。如果你等到明天的话,你可能得在地狱里待一天,这是真的,但和以后无穷无尽的日子相比,一天可以忽略不计。于是你开始计算:

E(d)=0.5×106+0.5×(106)=0E(m)=0.75×106+0.25×(106)=0.5×106\begin{aligned} E(d) & = 0.5\times 10^6 + 0.5\times(-10^6)=0 \\ E(m) & = 0.75\times 10^6 + 0.25\times(-10^6)=0.5\times 10^6 \end{aligned}

因此,你决定等到明天。

但明天魔鬼来告诉你,如果你再多等一天,胜算更高:它会升到 7/87/8(即,11/231-1/2^3)。我请读者自行计算:你应该决定再等一天。麻烦在于,如果你愿意等到下一天的话,魔鬼每天都来提供一个更高的胜算给你。胜算越来越高,日复一日:

11/2,11/22,11/23,11/24,,11/2n,1-1/2,1-1/2^2,1-1/2^3,1-1/2^4,\ldots,1-1/2^n,\ldots

每天你都进行计算。在第 nn 天掷硬币的期望值是:

(11/2n)×106+1/2n×(106)(1-1/2^n)\times 10^6+1/2^n\times(-10^6)

一点算术知识告诉我们,它等于 106×(12/2n)=106×(11/2n110^6\times(1-2/2^n)=10^6\times(1-1/2^{n-1}。而等到下一天,第 n+1n+1 天的期望值也是一样的,只是把 nn 换成 n+1n+1,即 106×(11/2n)10^6\times(1-1/2^n),它要更大。(1/2n1/2^n 小于 1/2n11/2^{n-1}。)期望值每天都在升高。

因此,每天你都理性地等到下一天。结果你永远也没有掷出硬币,因而你永远待在地狱!在任何一天掷出硬币都要好得多。那么,看上去你要做的唯一理性之事就是不再理性。

本章要点

  • E(a)=pr(o1)×V(o1)pr(on)×V(on)E(a)=pr(o_1)\times V(o_1)\ldots pr(o_n)\times V(o_n),其中 o1,,ono_1,\ldots,o_n 表示 aa 为真时所有可能的结果。

  • 理性的行动是为真时具有最大期望值的行动。

最后更新于