生活时常迫使我们在各个范围(个人、家庭和社会)和各个领域(道德、经济和政治)内做出选择,尽管我们可能不太了解当时的环境、其他人的行为以及各种选择造成的后果。博弈论的目标是以一种典型的科学方式,也就是从实际情况中抽取出能用形式化的方法来处理的基本要素,为我们的决策过程建立一种数学模型。
博弈论的例子可以追溯到卢梭1755年出版的《论人类不平等的起源与基础》。在其中一节中他写道,当两个人合作追捕一只鹿时,其中一人可能碰巧看到一只野兔,他完全可以靠自己的实力捕捉到这只野兔,于是可能禁不住去抓这只野兔。因为尽管抓到鹿要比抓到野兔好,但抓到野兔总要比什么也抓不到好。由于想到对方也可能不去抓鹿而去抓野兔,他抓野兔的想法便更强烈了。
现实生活的博弈游戏中也有许多这样的例子,这就是“博弈论”
名称的来源。像纸牌或国际象棋这类游戏,不仅可以用来娱乐,也可以训练思维,比如玩军棋时要用到军用地图和玩具兵。人们认为,1866年的普奥战争、1870年的普法战争和1905年的日俄战争中使用的成功战略都是从军棋游戏中获得的灵感。
1928年,冯·诺伊曼利用布劳威尔的不动点定理证明了博弈论的第一个深刻定理,指出在所谓的零和博弈(即参赛双方中一方的收益等于另一方的损失)和全信息博弈(即参赛双方都明确知道对方可能采取的策略以及造成的结果)中,存在一种策略可以使参赛双方都使他们的最大损失极小化。这就是“极小化极大”这一名称的来源。
1950年,纳什提出“纳什均衡”的概念,这是对最优策略给出的最令人满意的形式。特别地,在零和博弈这种情况中,纳什均衡概念正好就是冯·诺伊曼的“极小化极大”。纳什证明,两人或多人参加的非合作博弈(不一定是零和博弈)能够达到一种均衡。1994年,他因此项工作荣获诺贝尔经济学奖。
“纳什均衡”是合理行为的一个必要条件,但不是充分条件,因为在有些博弈中“纳什均衡”状态完全不合理。1950年,艾伯特·塔克提出的“囚徒困境”
就是一个典型的例子。警察抓捕了两个犯罪嫌疑人,并把他们关在不同的房间审讯。如果只有一个人指控另一个人,那么指控人就会无罪释放,被指控人则被判刑10年。如果双方相互指控,他们就都被判刑5年。但如果双方都不指控对方,便能同时无罪释放。“纳什均衡”
在这种情况下就是犯罪嫌疑人相互指控对方,但这并不合理,因为最好的办法是他们都不指控对方。
20世纪下半叶,博弈论在冲突的分析和解决过程中扮演着重要角色,为各个工业化国家,特别是美国政府官员的军事、经济及政治顾问所广泛采用。
