# 第13章：决策论：远大期望

让我们看一下关于归纳推理的一个最后问题。这个主题有时也称作**实践推理**（*practial reasoning*），因为它是对人们应该如何行动进行推理。下面是一条著名的实践推理。

你可以选择相信（一个基督教的）上帝存在，也可以选择不相信。让我们假设你选择相信。上帝要么存在要么不存在。如果上帝存在，一切好说。如果不存在，那么你的信念会带来小小的不便：它意味着你要浪费一点时间在教堂里，也许还要做少量其他你本来不想做的事；但这些都不是灾难性的。另一方面，现在假设你选择不相信上帝存在。同样，上帝要么存在要么不存在。如果上帝不存在，一切好说。但如果上帝**真的**存在，老兄你就有麻烦了！你死后会遭受很多痛苦；如果得不到一点宽恕的话，也许会永世不得翻身。因此，任何明智之人都应该选择相信上帝存在。这是唯一谨慎的选择。

这个论证现在通常称作**帕斯卡赌注**（*Pascal's Wager*），以首次提出它的 17 世纪哲学家布莱斯·帕斯卡命名。关于这个赌注有什么要说的呢？

让我们稍微思考一下这类推理是如何进行的。我们先从一个不那么有争议的例子开始。当我们实施行动时，我们往往不确定最后的结果，它们可能不完全受我们的控制。但我们通常能估计各种结果的可能性有多大；同样重要的是，我们能估计各种结果对我们的价值有多大。按照惯例，我们可以通过对每个结果在下面的范围指派一个数字来度量其价值，这个范围在两个方向上都是无限的：

$$
\ldots,-4,-3,-1,0,+1,+2,+3,+4,\ldots
$$

正数是好的，越往右越好。负数是差的，越往左越差。$$0$$ 是无差别点：做不做都行。

现在，假设有一个我们可能会实施的行动，比方说去骑自行车。然而，天也许会下雨。不下雨的时候骑自行车会很有乐趣，因此我们会赋予它一个值，比方说 $$+10$$。但下雨时骑自行车就很悲催，因此我们会赋予它一个值，比方说 $$-5$$。对我们唯一能控制的事情——去骑自行车，我们应该赋什么值呢？我们可以只是把两个数字 $$-5$$ 和 $$10$$ 加在一起，但那样就漏掉了这个情景中的一个重要部分。也许下雨的可能性非常低，因此尽管可能下雨是不好的，我们也不希望给它太多权重。假设下雨的概率是，比方说 $$0.1$$；相应的，不下雨的概率就是 $$0.9$$。那么我们可以用相应的概率对值进行加权，得到总的值为：

$$
0.10\times(-5)+0.9\times 10
$$

它等于 $$8.5$$，我们把它称作上述行动——去骑自行车的**期望值**（*expectation*）。（这里的“期望”是一个专业术语，它和我们日常使用这个词的意义实际上没有什么关系。）

一般地，令 $$a$$ 表示：我们实施某个行动。简单起见，假设只有两个可能的结果。令 $$o\_1$$ 表示其中一个结果出现，令 $$o\_2$$ 表示另一个结果出现。最后，令 $$V(o)$$ 表示 $$o$$ 为真时我们赋予它的价值。那么 $$a$$ 的期望值 $$E(a)$$ 就是如下定义的数：

$$
pr(o\_1)\times V(o\_1)+pr(o\_2)\times V(o\_2)
$$

（严格说来，上述概率应该分别为条件概率 $$pr(o\_1|a)$$ 和 $$pr(o\_2|a)$$。但在这个例子中，出去骑自行车对下雨的概率没有影响。我们要考察的所有其他例子也都是如此。因此我们这里可以一直使用简单的先验概率。）

目前为止都没问题。但这如何帮助我们决定是否要去骑自行车呢？我们知道去骑单车的总体价值。正如我们已经看到的，其期望值为 $$8.5$$。不去骑自行车的期望值是多少呢？同样，要么下雨要么不下雨——概率和前面一样。现在的两个结果是：(i) 下雨我待在家里；(ii) 不下雨我待在家里。两种情况我都得不到骑自行车的乐趣。如果不下雨的话，情况可能或略遭一点。在那种情况下，我可能会对没有去骑自行车而感到懊恼。但两种情况都不会比淋成落汤鸡更糟。因此，如果下雨，价值可能为 $$0$$，不下雨，价值可能为 $$-1$$。现在就可以计算待在家里的期望值了：

$$
0.10\times 0+0.9\times(-1)
$$

结果为 $$-0.9$$，这给了我们需要的信息；因为我应该选择具有最高总体价值（即期望值）的行动。在这个例子里，去骑自行车的期望值为 $$8.5$$，而待在家里的期望值为 $$-0.9$$。因此，我应该去骑自行车。

这样，给定 $$a$$ 和 $$\neg a$$ 之间的选择，我应该选择那个期望值更大的。（如果二者有相同的期望值，我随机选一个就行，比方说，通过掷硬币。）在前面的例子中，只有两种可能性。一般情况下，可能有更多可能性（比如，去骑自行车，去看电影和待在家里）。不过原理是一样的：计算每个可能性的期望值，然后选择期望值最大的那个。这种推理是来自逻辑学的一个分支——**决策论**（*decision theory*）的简单例子。

现在让我们回到帕斯卡赌注。在这个例子里，有两个可能的行动：相信或不相信；有两个相关可能性：上帝存在或上帝不存在。我们可以用下表来表示相关信息：

|                  |           上帝存在          |          上帝不存在          |
| ---------------- | :---------------------: | :---------------------: |
| 我相信（$$b$$）       |  $$0.1\backslash+10^2$$ |  $$0.9\backslash -10$$  |
| 我不相信（$$\neg b$$） | $$0.1\backslash -10^6$$ | $$0.9\backslash +10^2$$ |

反斜杠左边的数字是相关概率，比如，$$0.1$$ 是上帝存在的概率，$$0.9$$ 是上帝不存在的概率。（我是否相信上帝对上帝是否存在没有影响，因此两行的概率一样。）反斜杠右边的数字是相关价值。我不太关心上帝是否存在；重要的是我没有弄错；因此我没有弄错的这两种情况价值都是 $$+10^2$$。（也许人们在这里的偏好并不完全一样，但我们会看到，这无关紧要。）上帝不存在时相信它存在，会有一点不便，因此价值为 $$-10$$。不过，上帝存在却不相信它存在，那就真的糟糕了，因此价值为 $$-10^6$$。

给定这些值，我们可以算出相关的期望值：

$$
\begin{aligned}
E(b) & =0.1\times 10^2 +0.9\times(-10)\simeq 0\\
E(\neg b) & =0.1\times(-10^6)+0.9\times 10^2\simeq -10^5
\end{aligned}
$$

（$$\simeq$$ 意思是“约等于”。）我应该选择期望值更大的行动，即相信上帝存在。

你可能会认为，我选取的那些精确数值有点任意；它们的确如此。但事实上，那些精确数值具体是多少并没有多大关系。重要的是 $$-10^6$$ 这个值。这个数字表示事情真的很糟糕。（有时，决策论专家会把它写作 $$-\infty$$。）它是如此糟糕，以至于淹没了所有其他的数字，即使上帝存在的概率很低。这就是帕斯卡赌注有冲击力的地方。

这个赌注或许看上去相当有说服力，但事实上，它犯了一个十分简单的决策论错误。它忽略了一些相关的可能性。不是只有一个可能的神，而是有很多：基督教的神（上帝），伊斯兰教的真主阿拉，印度教的婆罗门，还有更多各种小宗教所崇拜的神。如果上帝存在而你不相信它，你会有麻烦；但如果阿拉存在而你不相信它，也会有同样的麻烦，如此等等。此外，如果上帝存在，你却信仰阿拉，或者反过来，阿拉存在而你信仰上帝，那么情况会更糟。因为无论是在基督教还是在伊斯兰教中，信仰错误的神比做简单的无信仰者要还要糟。我们画出具有更现实信息的表格如下：

|             |          没有神存在          |           上帝存在           |           阿拉存在           | $$\cdots$$ |
| ----------- | :---------------------: | :----------------------: | :----------------------: | :--------: |
| 无信仰（$$n$$）  | $$0.9\backslash +10^2$$ |  $$0.01\backslash-10^6$$ | $$0.01\backslash -10^6$$ | $$\cdots$$ |
| 信仰上帝（$$g$$） |  $$0.9\backslash -10$$  | $$0.01\backslash +10^2$$ | $$0.01\backslash -10^9$$ | $$\cdots$$ |
| 信仰阿拉（$$a$$） |  $$0.9\backslash -10$$  |  $$0.01\backslash-10^9$$ |  $$0.01\backslash+10^2$$ | $$\cdots$$ |
| $$\vdots$$  |        $$\vdots$$       |        $$\vdots$$        |        $$\vdots$$        |            |

如果我们根据这些即使有限的信息来计算期望值，我们会得到：

$$
\begin{aligned}
E(n) & =0.9\times 10^2 + 0.01\times(-10^6) + 0.01\times(-10^6)\simeq 2\times 10^4\\
E(g) & =0.9\times(-10)+0.01\times 10^2 +0.01\times(-10^9)\simeq -10^7\\
E(a) & = 0.9\times(-10) + 0.01\times(-10^9) + 0.01\times 10^2\simeq -10^7
\end{aligned}
$$

情况看上去都很惨淡。但很清楚的是，信仰有神论的结果会更加糟糕。你不应信仰它们中的任何一个。

和其他章一样，让我以如下方式结束本章。我会给出一些理由，说明人们为什么会担心这里给出的一般框架——具体到这里就是，根据最大期望值进行决策的策略。

假设你在帕斯卡赌注中下错了注，最后进了地狱。几天后，魔鬼带着一笔交易出现。上帝已发号施令，说你可以得到某种宽恕。因此魔鬼谋划了一个方案。他会给你一个逃出地狱的机会。你可以掷硬币，如果正面朝上，你就可以出地狱、升天堂。如果反面朝上，你就要永远待在地狱。然而，硬币并不是公平的，魔鬼可以控制胜算。如果你今天掷硬币，正面朝上的机会是 $$1/2$$（即，$$1-1/2$$）。如果你等到明天掷硬币，机会就上升到 $$3/4$$（即，$$1-1/2^2$$）。你把信息总结如下：

|              |           逃离地狱          |           待在地狱          |
| ------------ | :---------------------: | :---------------------: |
| 今天掷硬币（$$d$$） |  $$0.5\backslash+10^6$$ |  $$0.5\backslash-10^6$$ |
| 明天掷硬币（$$m$$） | $$0.75\backslash+10^6$$ | $$0.25\backslash-10^6$$ |

逃离地狱有一个很大的正值，待在地狱有一个很大的负值。并且，这些值在今天和明天是一样的。如果你等到明天的话，你可能得在地狱里**多**待一天，这是真的，但和以后无穷无尽的日子相比，一天可以忽略不计。于是你开始计算：

$$
\begin{aligned}
E(d) & = 0.5\times 10^6 + 0.5\times(-10^6)=0 \\
E(m) & = 0.75\times 10^6 + 0.25\times(-10^6)=0.5\times 10^6
\end{aligned}
$$

因此，你决定等到明天。

但明天魔鬼来告诉你，如果你再多等一天，胜算更高：它会升到 $$7/8$$（即，$$1-1/2^3$$）。我请读者自行计算：你应该决定再等一天。麻烦在于，如果你愿意等到下一天的话，魔鬼**每天**都来提供一个更高的胜算给你。胜算越来越高，日复一日：

$$
1-1/2,1-1/2^2,1-1/2^3,1-1/2^4,\ldots,1-1/2^n,\ldots
$$

每天你都进行计算。在第 $$n$$ 天掷硬币的期望值是：

$$
(1-1/2^n)\times 10^6+1/2^n\times(-10^6)
$$

一点算术知识告诉我们，它等于 $$10^6\times(1-2/2^n)=10^6\times(1-1/2^{n-1}$$。而等到下一天，第 $$n+1$$ 天的期望值也是一样的，只是把 $$n$$ 换成 $$n+1$$，即 $$10^6\times(1-1/2^n)$$，它要更大。（$$1/2^n$$ 小于 $$1/2^{n-1}$$。）期望值每天都在升高。

因此，每天你都理性地等到下一天。结果你永远也没有掷出硬币，因而你永远待在地狱！在**任何**一天掷出硬币都要好得多。那么，看上去你要做的唯一理性之事就是不再理性。

> 本章要点
>
> * $$E(a)=pr(o\_1)\times V(o\_1)\ldots pr(o\_n)\times V(o\_n)$$，其中 $$o\_1,\ldots,o\_n$$ 表示 $$a$$ 为真时所有可能的结果。
> * 理性的行动是为真时具有最大期望值的行动。


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://wxflogic.gitbook.io/logic/chapter13.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
