第13章：决策论：远大期望

让我们看一下关于归纳推理的一个最后问题。这个主题有时也称作实践推理（practial reasoning），因为它是对人们应该如何行动进行推理。下面是一条著名的实践推理。

你可以选择相信（一个基督教的）上帝存在，也可以选择不相信。让我们假设你选择相信。上帝要么存在要么不存在。如果上帝存在，一切好说。如果不存在，那么你的信念会带来小小的不便：它意味着你要浪费一点时间在教堂里，也许还要做少量其他你本来不想做的事；但这些都不是灾难性的。另一方面，现在假设你选择不相信上帝存在。同样，上帝要么存在要么不存在。如果上帝不存在，一切好说。但如果上帝真的存在，老兄你就有麻烦了！你死后会遭受很多痛苦；如果得不到一点宽恕的话，也许会永世不得翻身。因此，任何明智之人都应该选择相信上帝存在。这是唯一谨慎的选择。

这个论证现在通常称作帕斯卡赌注（Pascal's Wager），以首次提出它的 17 世纪哲学家布莱斯·帕斯卡命名。关于这个赌注有什么要说的呢？

让我们稍微思考一下这类推理是如何进行的。我们先从一个不那么有争议的例子开始。当我们实施行动时，我们往往不确定最后的结果，它们可能不完全受我们的控制。但我们通常能估计各种结果的可能性有多大；同样重要的是，我们能估计各种结果对我们的价值有多大。按照惯例，我们可以通过对每个结果在下面的范围指派一个数字来度量其价值，这个范围在两个方向上都是无限的：

\ldots,-4,-3,-1,0,+1,+2,+3,+4,\ldots

正数是好的，越往右越好。负数是差的，越往左越差。 $0$ 是无差别点：做不做都行。

现在，假设有一个我们可能会实施的行动，比方说去骑自行车。然而，天也许会下雨。不下雨的时候骑自行车会很有乐趣，因此我们会赋予它一个值，比方说 $+10$ 。但下雨时骑自行车就很悲催，因此我们会赋予它一个值，比方说 $-5$ 。对我们唯一能控制的事情——去骑自行车，我们应该赋什么值呢？我们可以只是把两个数字 $-5$ 和 $10$ 加在一起，但那样就漏掉了这个情景中的一个重要部分。也许下雨的可能性非常低，因此尽管可能下雨是不好的，我们也不希望给它太多权重。假设下雨的概率是，比方说 $0.1$ ；相应的，不下雨的概率就是 $0.9$ 。那么我们可以用相应的概率对值进行加权，得到总的值为：

0.10\times(-5)+0.9\times 10

它等于 $8.5$ ，我们把它称作上述行动——去骑自行车的期望值（expectation）。（这里的“期望”是一个专业术语，它和我们日常使用这个词的意义实际上没有什么关系。）

一般地，令 $a$ 表示：我们实施某个行动。简单起见，假设只有两个可能的结果。令 $o_1$ 表示其中一个结果出现，令 $o_2$ 表示另一个结果出现。最后，令 $V(o)$ 表示 $o$ 为真时我们赋予它的价值。那么 $a$ 的期望值 $E(a)$ 就是如下定义的数：

pr(o_1)\times V(o_1)+pr(o_2)\times V(o_2)

（严格说来，上述概率应该分别为条件概率 $pr(o_1|a)$ 和 $pr(o_2|a)$ 。但在这个例子中，出去骑自行车对下雨的概率没有影响。我们要考察的所有其他例子也都是如此。因此我们这里可以一直使用简单的先验概率。）

目前为止都没问题。但这如何帮助我们决定是否要去骑自行车呢？我们知道去骑单车的总体价值。正如我们已经看到的，其期望值为 $8.5$ 。不去骑自行车的期望值是多少呢？同样，要么下雨要么不下雨——概率和前面一样。现在的两个结果是：(i) 下雨我待在家里；(ii) 不下雨我待在家里。两种情况我都得不到骑自行车的乐趣。如果不下雨的话，情况可能或略遭一点。在那种情况下，我可能会对没有去骑自行车而感到懊恼。但两种情况都不会比淋成落汤鸡更糟。因此，如果下雨，价值可能为 $0$ ，不下雨，价值可能为 $-1$ 。现在就可以计算待在家里的期望值了：

0.10\times 0+0.9\times(-1)

结果为 $-0.9$ ，这给了我们需要的信息；因为我应该选择具有最高总体价值（即期望值）的行动。在这个例子里，去骑自行车的期望值为 $8.5$ ，而待在家里的期望值为 $-0.9$ 。因此，我应该去骑自行车。

这样，给定 $a$ 和 $\neg a$ 之间的选择，我应该选择那个期望值更大的。（如果二者有相同的期望值，我随机选一个就行，比方说，通过掷硬币。）在前面的例子中，只有两种可能性。一般情况下，可能有更多可能性（比如，去骑自行车，去看电影和待在家里）。不过原理是一样的：计算每个可能性的期望值，然后选择期望值最大的那个。这种推理是来自逻辑学的一个分支——决策论（decision theory）的简单例子。

现在让我们回到帕斯卡赌注。在这个例子里，有两个可能的行动：相信或不相信；有两个相关可能性：上帝存在或上帝不存在。我们可以用下表来表示相关信息：

上帝存在

上帝不存在

我相信（ $b$ ）

$0.1\backslash+10^2$

$0.9\backslash -10$

我不相信（ $\neg b$ ）

$0.1\backslash -10^6$

$0.9\backslash +10^2$

反斜杠左边的数字是相关概率，比如， $0.1$ 是上帝存在的概率， $0.9$ 是上帝不存在的概率。（我是否相信上帝对上帝是否存在没有影响，因此两行的概率一样。）反斜杠右边的数字是相关价值。我不太关心上帝是否存在；重要的是我没有弄错；因此我没有弄错的这两种情况价值都是 $+10^2$ 。（也许人们在这里的偏好并不完全一样，但我们会看到，这无关紧要。）上帝不存在时相信它存在，会有一点不便，因此价值为 $-10$ 。不过，上帝存在却不相信它存在，那就真的糟糕了，因此价值为 $-10^6$ 。

给定这些值，我们可以算出相关的期望值：

\begin{aligned} E(b) & =0.1\times 10^2 +0.9\times(-10)\simeq 0\\ E(\neg b) & =0.1\times(-10^6)+0.9\times 10^2\simeq -10^5 \end{aligned}

（ $\simeq$ 意思是“约等于”。）我应该选择期望值更大的行动，即相信上帝存在。

你可能会认为，我选取的那些精确数值有点任意；它们的确如此。但事实上，那些精确数值具体是多少并没有多大关系。重要的是 $-10^6$ 这个值。这个数字表示事情真的很糟糕。（有时，决策论专家会把它写作 $-\infty$ 。）它是如此糟糕，以至于淹没了所有其他的数字，即使上帝存在的概率很低。这就是帕斯卡赌注有冲击力的地方。

这个赌注或许看上去相当有说服力，但事实上，它犯了一个十分简单的决策论错误。它忽略了一些相关的可能性。不是只有一个可能的神，而是有很多：基督教的神（上帝），伊斯兰教的真主阿拉，印度教的婆罗门，还有更多各种小宗教所崇拜的神。如果上帝存在而你不相信它，你会有麻烦；但如果阿拉存在而你不相信它，也会有同样的麻烦，如此等等。此外，如果上帝存在，你却信仰阿拉，或者反过来，阿拉存在而你信仰上帝，那么情况会更糟。因为无论是在基督教还是在伊斯兰教中，信仰错误的神比做简单的无信仰者要还要糟。我们画出具有更现实信息的表格如下：

没有神存在

上帝存在

阿拉存在

$\cdots$

无信仰（ $n$ ）

$0.9\backslash +10^2$

$0.01\backslash-10^6$

$0.01\backslash -10^6$

$\cdots$

信仰上帝（ $g$ ）

$0.9\backslash -10$

$0.01\backslash +10^2$

$0.01\backslash -10^9$

$\cdots$

信仰阿拉（ $a$ ）

$0.9\backslash -10$

$0.01\backslash-10^9$

$0.01\backslash+10^2$

$\cdots$

$\vdots$

如果我们根据这些即使有限的信息来计算期望值，我们会得到：

\begin{aligned} E(n) & =0.9\times 10^2 + 0.01\times(-10^6) + 0.01\times(-10^6)\simeq 2\times 10^4\\ E(g) & =0.9\times(-10)+0.01\times 10^2 +0.01\times(-10^9)\simeq -10^7\\ E(a) & = 0.9\times(-10) + 0.01\times(-10^9) + 0.01\times 10^2\simeq -10^7 \end{aligned}

情况看上去都很惨淡。但很清楚的是，信仰有神论的结果会更加糟糕。你不应信仰它们中的任何一个。

和其他章一样，让我以如下方式结束本章。我会给出一些理由，说明人们为什么会担心这里给出的一般框架——具体到这里就是，根据最大期望值进行决策的策略。

假设你在帕斯卡赌注中下错了注，最后进了地狱。几天后，魔鬼带着一笔交易出现。上帝已发号施令，说你可以得到某种宽恕。因此魔鬼谋划了一个方案。他会给你一个逃出地狱的机会。你可以掷硬币，如果正面朝上，你就可以出地狱、升天堂。如果反面朝上，你就要永远待在地狱。然而，硬币并不是公平的，魔鬼可以控制胜算。如果你今天掷硬币，正面朝上的机会是 $1/2$ （即， $1-1/2$ ）。如果你等到明天掷硬币，机会就上升到 $3/4$ （即， $1-1/2^2$ ）。你把信息总结如下：

逃离地狱

待在地狱

今天掷硬币（ $d$ ）

$0.5\backslash+10^6$

$0.5\backslash-10^6$

明天掷硬币（ $m$ ）

$0.75\backslash+10^6$

$0.25\backslash-10^6$

逃离地狱有一个很大的正值，待在地狱有一个很大的负值。并且，这些值在今天和明天是一样的。如果你等到明天的话，你可能得在地狱里多待一天，这是真的，但和以后无穷无尽的日子相比，一天可以忽略不计。于是你开始计算：

\begin{aligned} E(d) & = 0.5\times 10^6 + 0.5\times(-10^6)=0 \\ E(m) & = 0.75\times 10^6 + 0.25\times(-10^6)=0.5\times 10^6 \end{aligned}

因此，你决定等到明天。

但明天魔鬼来告诉你，如果你再多等一天，胜算更高：它会升到 $7/8$ （即， $1-1/2^3$ ）。我请读者自行计算：你应该决定再等一天。麻烦在于，如果你愿意等到下一天的话，魔鬼每天都来提供一个更高的胜算给你。胜算越来越高，日复一日：

1-1/2,1-1/2^2,1-1/2^3,1-1/2^4,\ldots,1-1/2^n,\ldots

每天你都进行计算。在第 $n$ 天掷硬币的期望值是：

(1-1/2^n)\times 10^6+1/2^n\times(-10^6)

一点算术知识告诉我们，它等于 $10^6\times(1-2/2^n)=10^6\times(1-1/2^{n-1}$ 。而等到下一天，第 $n+1$ 天的期望值也是一样的，只是把 $n$ 换成 $n+1$ ，即 $10^6\times(1-1/2^n)$ ，它要更大。（ $1/2^n$ 小于 $1/2^{n-1}$ 。）期望值每天都在升高。

因此，每天你都理性地等到下一天。结果你永远也没有掷出硬币，因而你永远待在地狱！在任何一天掷出硬币都要好得多。那么，看上去你要做的唯一理性之事就是不再理性。

本章要点
$E(a)=pr(o_1)\times V(o_1)\ldots pr(o_n)\times V(o_n)$ ，其中 $o_1,\ldots,o_n$ 表示 $a$ 为真时所有可能的结果。
理性的行动是为真时具有最大期望值的行动。

上一页第12章：互逆概率：你无法忽略其差别！下一页第14章：停！发生什么了？

最后更新于5年前

这有帮助吗？