逻辑学简短入门(牛津通识读本)
  • 重译说明
  • 前言
  • 第1章:有效性:从什么可以推出什么?
  • 第2章(上):真值函数——亦或不是?
  • 第2章(下)真值函数——亦或不是?
  • 第3章:名称与量词:空无一物是某物吗?
  • 第4章(上):摹状词与存在:古希腊人崇拜宙斯吗?
  • 第4章(下):摹状词与存在:古希腊人崇拜宙斯吗?
  • 第5章:自指:本章是关于什么的?
  • 第6章:必然与可能:什么会是一定如此的?
  • 第7章:条件句:“如果”中有什么?
  • 第8章:将来和过去:时间是真实的吗?
  • 第9章:同一性与变化:有什么是一成不变的吗?
  • 第10章:模糊性:如何在滑坡上停止下滑?
  • 第11章:概率:缺少参照类的奇怪情形
  • 第12章:互逆概率:你无法忽略其差别!
  • 第13章:决策论:远大期望
  • 第14章:停!发生什么了?
  • 第15章:也许为真——但你无法证明!
  • 第16章:一点历史与进阶阅读
  • 术语表
  • 习题
  • 参考文献
  • 附录:习题解答
由 GitBook 提供支持
在本页

这有帮助吗?

第13章:决策论:远大期望

上一页第12章:互逆概率:你无法忽略其差别!下一页第14章:停!发生什么了?

最后更新于5年前

这有帮助吗?

让我们看一下关于归纳推理的一个最后问题。这个主题有时也称作实践推理(practial reasoning),因为它是对人们应该如何行动进行推理。下面是一条著名的实践推理。

你可以选择相信(一个基督教的)上帝存在,也可以选择不相信。让我们假设你选择相信。上帝要么存在要么不存在。如果上帝存在,一切好说。如果不存在,那么你的信念会带来小小的不便:它意味着你要浪费一点时间在教堂里,也许还要做少量其他你本来不想做的事;但这些都不是灾难性的。另一方面,现在假设你选择不相信上帝存在。同样,上帝要么存在要么不存在。如果上帝不存在,一切好说。但如果上帝真的存在,老兄你就有麻烦了!你死后会遭受很多痛苦;如果得不到一点宽恕的话,也许会永世不得翻身。因此,任何明智之人都应该选择相信上帝存在。这是唯一谨慎的选择。

这个论证现在通常称作帕斯卡赌注(Pascal's Wager),以首次提出它的 17 世纪哲学家布莱斯·帕斯卡命名。关于这个赌注有什么要说的呢?

让我们稍微思考一下这类推理是如何进行的。我们先从一个不那么有争议的例子开始。当我们实施行动时,我们往往不确定最后的结果,它们可能不完全受我们的控制。但我们通常能估计各种结果的可能性有多大;同样重要的是,我们能估计各种结果对我们的价值有多大。按照惯例,我们可以通过对每个结果在下面的范围指派一个数字来度量其价值,这个范围在两个方向上都是无限的:

…,−4,−3,−1,0,+1,+2,+3,+4,…\ldots,-4,-3,-1,0,+1,+2,+3,+4,\ldots…,−4,−3,−1,0,+1,+2,+3,+4,…

正数是好的,越往右越好。负数是差的,越往左越差。000 是无差别点:做不做都行。

现在,假设有一个我们可能会实施的行动,比方说去骑自行车。然而,天也许会下雨。不下雨的时候骑自行车会很有乐趣,因此我们会赋予它一个值,比方说 +10+10+10。但下雨时骑自行车就很悲催,因此我们会赋予它一个值,比方说 −5-5−5。对我们唯一能控制的事情——去骑自行车,我们应该赋什么值呢?我们可以只是把两个数字 −5-5−5 和 101010 加在一起,但那样就漏掉了这个情景中的一个重要部分。也许下雨的可能性非常低,因此尽管可能下雨是不好的,我们也不希望给它太多权重。假设下雨的概率是,比方说 0.10.10.1;相应的,不下雨的概率就是 0.90.90.9。那么我们可以用相应的概率对值进行加权,得到总的值为:

0.10×(−5)+0.9×100.10\times(-5)+0.9\times 100.10×(−5)+0.9×10

它等于 8.58.58.5,我们把它称作上述行动——去骑自行车的期望值(expectation)。(这里的“期望”是一个专业术语,它和我们日常使用这个词的意义实际上没有什么关系。)

一般地,令 aaa 表示:我们实施某个行动。简单起见,假设只有两个可能的结果。令 o1o_1o1​ 表示其中一个结果出现,令 o2o_2o2​ 表示另一个结果出现。最后,令 V(o)V(o)V(o) 表示 ooo 为真时我们赋予它的价值。那么 aaa 的期望值 E(a)E(a)E(a) 就是如下定义的数:

pr(o1)×V(o1)+pr(o2)×V(o2)pr(o_1)\times V(o_1)+pr(o_2)\times V(o_2)pr(o1​)×V(o1​)+pr(o2​)×V(o2​)

现在让我们回到帕斯卡赌注。在这个例子里,有两个可能的行动:相信或不相信;有两个相关可能性:上帝存在或上帝不存在。我们可以用下表来表示相关信息:

上帝存在

上帝不存在

给定这些值,我们可以算出相关的期望值:

这个赌注或许看上去相当有说服力,但事实上,它犯了一个十分简单的决策论错误。它忽略了一些相关的可能性。不是只有一个可能的神,而是有很多:基督教的神(上帝),伊斯兰教的真主阿拉,印度教的婆罗门,还有更多各种小宗教所崇拜的神。如果上帝存在而你不相信它,你会有麻烦;但如果阿拉存在而你不相信它,也会有同样的麻烦,如此等等。此外,如果上帝存在,你却信仰阿拉,或者反过来,阿拉存在而你信仰上帝,那么情况会更糟。因为无论是在基督教还是在伊斯兰教中,信仰错误的神比做简单的无信仰者要还要糟。我们画出具有更现实信息的表格如下:

没有神存在

上帝存在

阿拉存在

如果我们根据这些即使有限的信息来计算期望值,我们会得到:

情况看上去都很惨淡。但很清楚的是,信仰有神论的结果会更加糟糕。你不应信仰它们中的任何一个。

和其他章一样,让我以如下方式结束本章。我会给出一些理由,说明人们为什么会担心这里给出的一般框架——具体到这里就是,根据最大期望值进行决策的策略。

逃离地狱

待在地狱

逃离地狱有一个很大的正值,待在地狱有一个很大的负值。并且,这些值在今天和明天是一样的。如果你等到明天的话,你可能得在地狱里多待一天,这是真的,但和以后无穷无尽的日子相比,一天可以忽略不计。于是你开始计算:

因此,你决定等到明天。

因此,每天你都理性地等到下一天。结果你永远也没有掷出硬币,因而你永远待在地狱!在任何一天掷出硬币都要好得多。那么,看上去你要做的唯一理性之事就是不再理性。

本章要点

  • 理性的行动是为真时具有最大期望值的行动。

(严格说来,上述概率应该分别为条件概率 pr(o1∣a)pr(o_1|a)pr(o1​∣a) 和 pr(o2∣a)pr(o_2|a)pr(o2​∣a)。但在这个例子中,出去骑自行车对下雨的概率没有影响。我们要考察的所有其他例子也都是如此。因此我们这里可以一直使用简单的先验概率。)

目前为止都没问题。但这如何帮助我们决定是否要去骑自行车呢?我们知道去骑单车的总体价值。正如我们已经看到的,其期望值为 8.58.58.5。不去骑自行车的期望值是多少呢?同样,要么下雨要么不下雨——概率和前面一样。现在的两个结果是:(i) 下雨我待在家里;(ii) 不下雨我待在家里。两种情况我都得不到骑自行车的乐趣。如果不下雨的话,情况可能或略遭一点。在那种情况下,我可能会对没有去骑自行车而感到懊恼。但两种情况都不会比淋成落汤鸡更糟。因此,如果下雨,价值可能为 000,不下雨,价值可能为 −1-1−1。现在就可以计算待在家里的期望值了:

0.10×0+0.9×(−1)0.10\times 0+0.9\times(-1)0.10×0+0.9×(−1)

结果为 −0.9-0.9−0.9,这给了我们需要的信息;因为我应该选择具有最高总体价值(即期望值)的行动。在这个例子里,去骑自行车的期望值为 8.58.58.5,而待在家里的期望值为 −0.9-0.9−0.9。因此,我应该去骑自行车。

这样,给定 aaa 和 ¬a\neg a¬a 之间的选择,我应该选择那个期望值更大的。(如果二者有相同的期望值,我随机选一个就行,比方说,通过掷硬币。)在前面的例子中,只有两种可能性。一般情况下,可能有更多可能性(比如,去骑自行车,去看电影和待在家里)。不过原理是一样的:计算每个可能性的期望值,然后选择期望值最大的那个。这种推理是来自逻辑学的一个分支——决策论(decision theory)的简单例子。

我相信()

我不相信()

反斜杠左边的数字是相关概率,比如,0.10.10.1 是上帝存在的概率,0.90.90.9 是上帝不存在的概率。(我是否相信上帝对上帝是否存在没有影响,因此两行的概率一样。)反斜杠右边的数字是相关价值。我不太关心上帝是否存在;重要的是我没有弄错;因此我没有弄错的这两种情况价值都是 +102+10^2+102。(也许人们在这里的偏好并不完全一样,但我们会看到,这无关紧要。)上帝不存在时相信它存在,会有一点不便,因此价值为 −10-10−10。不过,上帝存在却不相信它存在,那就真的糟糕了,因此价值为 −106-10^6−106。

E(b)=0.1×102+0.9×(−10)≃0E(¬b)=0.1×(−106)+0.9×102≃−105\begin{aligned} E(b) & =0.1\times 10^2 +0.9\times(-10)\simeq 0\\ E(\neg b) & =0.1\times(-10^6)+0.9\times 10^2\simeq -10^5 \end{aligned}E(b)E(¬b)​=0.1×102+0.9×(−10)≃0=0.1×(−106)+0.9×102≃−105​

(≃\simeq≃ 意思是“约等于”。)我应该选择期望值更大的行动,即相信上帝存在。

你可能会认为,我选取的那些精确数值有点任意;它们的确如此。但事实上,那些精确数值具体是多少并没有多大关系。重要的是 −106-10^6−106 这个值。这个数字表示事情真的很糟糕。(有时,决策论专家会把它写作 −∞-\infty−∞。)它是如此糟糕,以至于淹没了所有其他的数字,即使上帝存在的概率很低。这就是帕斯卡赌注有冲击力的地方。

无信仰()

信仰上帝()

信仰阿拉()

E(n)=0.9×102+0.01×(−106)+0.01×(−106)≃2×104E(g)=0.9×(−10)+0.01×102+0.01×(−109)≃−107E(a)=0.9×(−10)+0.01×(−109)+0.01×102≃−107\begin{aligned} E(n) & =0.9\times 10^2 + 0.01\times(-10^6) + 0.01\times(-10^6)\simeq 2\times 10^4\\ E(g) & =0.9\times(-10)+0.01\times 10^2 +0.01\times(-10^9)\simeq -10^7\\ E(a) & = 0.9\times(-10) + 0.01\times(-10^9) + 0.01\times 10^2\simeq -10^7 \end{aligned}E(n)E(g)E(a)​=0.9×102+0.01×(−106)+0.01×(−106)≃2×104=0.9×(−10)+0.01×102+0.01×(−109)≃−107=0.9×(−10)+0.01×(−109)+0.01×102≃−107​

假设你在帕斯卡赌注中下错了注,最后进了地狱。几天后,魔鬼带着一笔交易出现。上帝已发号施令,说你可以得到某种宽恕。因此魔鬼谋划了一个方案。他会给你一个逃出地狱的机会。你可以掷硬币,如果正面朝上,你就可以出地狱、升天堂。如果反面朝上,你就要永远待在地狱。然而,硬币并不是公平的,魔鬼可以控制胜算。如果你今天掷硬币,正面朝上的机会是 1/21/21/2(即,1−1/21-1/21−1/2)。如果你等到明天掷硬币,机会就上升到 3/43/43/4(即,1−1/221-1/2^21−1/22)。你把信息总结如下:

今天掷硬币()

明天掷硬币()

E(d)=0.5×106+0.5×(−106)=0E(m)=0.75×106+0.25×(−106)=0.5×106\begin{aligned} E(d) & = 0.5\times 10^6 + 0.5\times(-10^6)=0 \\ E(m) & = 0.75\times 10^6 + 0.25\times(-10^6)=0.5\times 10^6 \end{aligned}E(d)E(m)​=0.5×106+0.5×(−106)=0=0.75×106+0.25×(−106)=0.5×106​

但明天魔鬼来告诉你,如果你再多等一天,胜算更高:它会升到 7/87/87/8(即,1−1/231-1/2^31−1/23)。我请读者自行计算:你应该决定再等一天。麻烦在于,如果你愿意等到下一天的话,魔鬼每天都来提供一个更高的胜算给你。胜算越来越高,日复一日:

1−1/2,1−1/22,1−1/23,1−1/24,…,1−1/2n,…1-1/2,1-1/2^2,1-1/2^3,1-1/2^4,\ldots,1-1/2^n,\ldots1−1/2,1−1/22,1−1/23,1−1/24,…,1−1/2n,…

每天你都进行计算。在第 nnn 天掷硬币的期望值是:

(1−1/2n)×106+1/2n×(−106)(1-1/2^n)\times 10^6+1/2^n\times(-10^6)(1−1/2n)×106+1/2n×(−106)

一点算术知识告诉我们,它等于 106×(1−2/2n)=106×(1−1/2n−110^6\times(1-2/2^n)=10^6\times(1-1/2^{n-1}106×(1−2/2n)=106×(1−1/2n−1。而等到下一天,第 n+1n+1n+1 天的期望值也是一样的,只是把 nnn 换成 n+1n+1n+1,即 106×(1−1/2n)10^6\times(1-1/2^n)106×(1−1/2n),它要更大。(1/2n1/2^n1/2n 小于 1/2n−11/2^{n-1}1/2n−1。)期望值每天都在升高。

E(a)=pr(o1)×V(o1)…pr(on)×V(on)E(a)=pr(o_1)\times V(o_1)\ldots pr(o_n)\times V(o_n)E(a)=pr(o1​)×V(o1​)…pr(on​)×V(on​),其中 o1,…,ono_1,\ldots,o_no1​,…,on​ 表示 aaa 为真时所有可能的结果。

bbb
0.1\+1020.1\backslash+10^20.1\+102
0.9\−100.9\backslash -100.9\−10
¬b\neg b¬b
0.1\−1060.1\backslash -10^60.1\−106
0.9\+1020.9\backslash +10^20.9\+102
⋯\cdots⋯
nnn
0.9\+1020.9\backslash +10^20.9\+102
0.01\−1060.01\backslash-10^60.01\−106
0.01\−1060.01\backslash -10^60.01\−106
⋯\cdots⋯
ggg
0.9\−100.9\backslash -100.9\−10
0.01\+1020.01\backslash +10^20.01\+102
0.01\−1090.01\backslash -10^90.01\−109
⋯\cdots⋯
aaa
0.9\−100.9\backslash -100.9\−10
0.01\−1090.01\backslash-10^90.01\−109
0.01\+1020.01\backslash+10^20.01\+102
⋯\cdots⋯
⋮\vdots⋮
⋮\vdots⋮
⋮\vdots⋮
⋮\vdots⋮
ddd
0.5\+1060.5\backslash+10^60.5\+106
0.5\−1060.5\backslash-10^60.5\−106
mmm
0.75\+1060.75\backslash+10^60.75\+106
0.25\−1060.25\backslash-10^60.25\−106