第13章:决策论:远大期望
最后更新于
最后更新于
让我们看一下关于归纳推理的一个最后问题。这个主题有时也称作实践推理(practial reasoning),因为它是对人们应该如何行动进行推理。下面是一条著名的实践推理。
你可以选择相信(一个基督教的)上帝存在,也可以选择不相信。让我们假设你选择相信。上帝要么存在要么不存在。如果上帝存在,一切好说。如果不存在,那么你的信念会带来小小的不便:它意味着你要浪费一点时间在教堂里,也许还要做少量其他你本来不想做的事;但这些都不是灾难性的。另一方面,现在假设你选择不相信上帝存在。同样,上帝要么存在要么不存在。如果上帝不存在,一切好说。但如果上帝真的存在,老兄你就有麻烦了!你死后会遭受很多痛苦;如果得不到一点宽恕的话,也许会永世不得翻身。因此,任何明智之人都应该选择相信上帝存在。这是唯一谨慎的选择。
这个论证现在通常称作帕斯卡赌注(Pascal's Wager),以首次提出它的 17 世纪哲学家布莱斯·帕斯卡命名。关于这个赌注有什么要说的呢?
让我们稍微思考一下这类推理是如何进行的。我们先从一个不那么有争议的例子开始。当我们实施行动时,我们往往不确定最后的结果,它们可能不完全受我们的控制。但我们通常能估计各种结果的可能性有多大;同样重要的是,我们能估计各种结果对我们的价值有多大。按照惯例,我们可以通过对每个结果在下面的范围指派一个数字来度量其价值,这个范围在两个方向上都是无限的:
正数是好的,越往右越好。负数是差的,越往左越差。 是无差别点:做不做都行。
现在,假设有一个我们可能会实施的行动,比方说去骑自行车。然而,天也许会下雨。不下雨的时候骑自行车会很有乐趣,因此我们会赋予它一个值,比方说 。但下雨时骑自行车就很悲催,因此我们会赋予它一个值,比方说 。对我们唯一能控制的事情——去骑自行车,我们应该赋什么值呢?我们可以只是把两个数字 和 加在一起,但那样就漏掉了这个情景中的一个重要部分。也许下雨的可能性非常低,因此尽管可能下雨是不好的,我们也不希望给它太多权重。假设下雨的概率是,比方说 ;相应的,不下雨的概率就是 。那么我们可以用相应的概率对值进行加权,得到总的值为:
它等于 ,我们把它称作上述行动——去骑自行车的期望值(expectation)。(这里的“期望”是一个专业术语,它和我们日常使用这个词的意义实际上没有什么关系。)
一般地,令 表示:我们实施某个行动。简单起见,假设只有两个可能的结果。令 表示其中一个结果出现,令 表示另一个结果出现。最后,令 表示 为真时我们赋予它的价值。那么 的期望值 就是如下定义的数:
现在让我们回到帕斯卡赌注。在这个例子里,有两个可能的行动:相信或不相信;有两个相关可能性:上帝存在或上帝不存在。我们可以用下表来表示相关信息:
给定这些值,我们可以算出相关的期望值:
这个赌注或许看上去相当有说服力,但事实上,它犯了一个十分简单的决策论错误。它忽略了一些相关的可能性。不是只有一个可能的神,而是有很多:基督教的神(上帝),伊斯兰教的真主阿拉,印度教的婆罗门,还有更多各种小宗教所崇拜的神。如果上帝存在而你不相信它,你会有麻烦;但如果阿拉存在而你不相信它,也会有同样的麻烦,如此等等。此外,如果上帝存在,你却信仰阿拉,或者反过来,阿拉存在而你信仰上帝,那么情况会更糟。因为无论是在基督教还是在伊斯兰教中,信仰错误的神比做简单的无信仰者要还要糟。我们画出具有更现实信息的表格如下:
如果我们根据这些即使有限的信息来计算期望值,我们会得到:
情况看上去都很惨淡。但很清楚的是,信仰有神论的结果会更加糟糕。你不应信仰它们中的任何一个。
和其他章一样,让我以如下方式结束本章。我会给出一些理由,说明人们为什么会担心这里给出的一般框架——具体到这里就是,根据最大期望值进行决策的策略。
逃离地狱有一个很大的正值,待在地狱有一个很大的负值。并且,这些值在今天和明天是一样的。如果你等到明天的话,你可能得在地狱里多待一天,这是真的,但和以后无穷无尽的日子相比,一天可以忽略不计。于是你开始计算:
因此,你决定等到明天。
因此,每天你都理性地等到下一天。结果你永远也没有掷出硬币,因而你永远待在地狱!在任何一天掷出硬币都要好得多。那么,看上去你要做的唯一理性之事就是不再理性。
本章要点
理性的行动是为真时具有最大期望值的行动。
(严格说来,上述概率应该分别为条件概率 和 。但在这个例子中,出去骑自行车对下雨的概率没有影响。我们要考察的所有其他例子也都是如此。因此我们这里可以一直使用简单的先验概率。)
目前为止都没问题。但这如何帮助我们决定是否要去骑自行车呢?我们知道去骑单车的总体价值。正如我们已经看到的,其期望值为 。不去骑自行车的期望值是多少呢?同样,要么下雨要么不下雨——概率和前面一样。现在的两个结果是:(i) 下雨我待在家里;(ii) 不下雨我待在家里。两种情况我都得不到骑自行车的乐趣。如果不下雨的话,情况可能或略遭一点。在那种情况下,我可能会对没有去骑自行车而感到懊恼。但两种情况都不会比淋成落汤鸡更糟。因此,如果下雨,价值可能为 ,不下雨,价值可能为 。现在就可以计算待在家里的期望值了:
结果为 ,这给了我们需要的信息;因为我应该选择具有最高总体价值(即期望值)的行动。在这个例子里,去骑自行车的期望值为 ,而待在家里的期望值为 。因此,我应该去骑自行车。
这样,给定 和 之间的选择,我应该选择那个期望值更大的。(如果二者有相同的期望值,我随机选一个就行,比方说,通过掷硬币。)在前面的例子中,只有两种可能性。一般情况下,可能有更多可能性(比如,去骑自行车,去看电影和待在家里)。不过原理是一样的:计算每个可能性的期望值,然后选择期望值最大的那个。这种推理是来自逻辑学的一个分支——决策论(decision theory)的简单例子。
反斜杠左边的数字是相关概率,比如, 是上帝存在的概率, 是上帝不存在的概率。(我是否相信上帝对上帝是否存在没有影响,因此两行的概率一样。)反斜杠右边的数字是相关价值。我不太关心上帝是否存在;重要的是我没有弄错;因此我没有弄错的这两种情况价值都是 。(也许人们在这里的偏好并不完全一样,但我们会看到,这无关紧要。)上帝不存在时相信它存在,会有一点不便,因此价值为 。不过,上帝存在却不相信它存在,那就真的糟糕了,因此价值为 。
( 意思是“约等于”。)我应该选择期望值更大的行动,即相信上帝存在。
你可能会认为,我选取的那些精确数值有点任意;它们的确如此。但事实上,那些精确数值具体是多少并没有多大关系。重要的是 这个值。这个数字表示事情真的很糟糕。(有时,决策论专家会把它写作 。)它是如此糟糕,以至于淹没了所有其他的数字,即使上帝存在的概率很低。这就是帕斯卡赌注有冲击力的地方。
假设你在帕斯卡赌注中下错了注,最后进了地狱。几天后,魔鬼带着一笔交易出现。上帝已发号施令,说你可以得到某种宽恕。因此魔鬼谋划了一个方案。他会给你一个逃出地狱的机会。你可以掷硬币,如果正面朝上,你就可以出地狱、升天堂。如果反面朝上,你就要永远待在地狱。然而,硬币并不是公平的,魔鬼可以控制胜算。如果你今天掷硬币,正面朝上的机会是 (即,)。如果你等到明天掷硬币,机会就上升到 (即,)。你把信息总结如下:
但明天魔鬼来告诉你,如果你再多等一天,胜算更高:它会升到 (即,)。我请读者自行计算:你应该决定再等一天。麻烦在于,如果你愿意等到下一天的话,魔鬼每天都来提供一个更高的胜算给你。胜算越来越高,日复一日:
每天你都进行计算。在第 天掷硬币的期望值是:
一点算术知识告诉我们,它等于 。而等到下一天,第 天的期望值也是一样的,只是把 换成 ,即 ,它要更大。( 小于 。)期望值每天都在升高。
,其中 表示 为真时所有可能的结果。
上帝存在
上帝不存在
我相信()
我不相信()
没有神存在
上帝存在
阿拉存在
无信仰()
信仰上帝()
信仰阿拉()
逃离地狱
待在地狱
今天掷硬币()
明天掷硬币()