狻罰�夢鬧揮卸潭桃灰持劍�刪褪欽舛潭桃灰持匠閃瞬┺穆鄣木�湮南住T謖餛�畚鬧校�墒哺�雋瞬┺木�獾畝ㄒ澹�庋�木�獗蝗嗣淺浦��墒簿�狻�2
納什均衡是博弈的“解”。我們明白數學方程的“解”的意思——某個或某些變數取某個或某組值為方程的解是指它或它們使方程兩邊相等;對於不同種類的方程,我們有不同的求解方法;我們也明白什麼是一個定理“證明”,即,從某些公理或定理演繹地得到某個命題的過程。但對於一個博弈,我們如何下手研究呢?透過研究我們希望達到什麼目的呢?
在科學上了許多偉大人物的貢獻不在於解決什麼重大問題,而在於他們提出了某些重要概念,這些概念為該學科的其他人所採用。納什均衡便是博弈論中這樣的概念。
那麼什麼是納什均衡呢?簡單說就是,在博弈的每個參與人選擇一個策略而形成的一策略組合中,每個參與人面臨這樣的一種情況:當其他人不改變策略時,他此時的策略是最好的。也就是說,此時對每個人而言,在其他人不改變策略的情況下,若他改變策略,他的支付不會提高。在均衡點上,每一個理性的參與人都不會有單獨改變策略的衝動。納什均衡是一個穩定的點。
在囚徒困境中存在惟一的納什均衡,該均衡為兩個囚犯均選擇“招認”。這是一穩定的結果。
有些博弈的納什均衡點不止一個。如下述“夫妻博弈”(或稱性別之戰)中有兩個明顯的納什均衡點。丈夫帕特和妻子克里斯商量晚上的活動。丈夫喜歡看拳擊,而妻子喜歡欣賞歌劇。但兩人都希望在一起度過夜晚,雙方的支付矩陣如下:
夫妻博弈
丈夫
妻子
歌劇
拳擊
歌劇
2,1
0,0
拳擊
0,0
1,2 在這個“夫妻博弈”中有兩個納什均衡點:(歌劇,歌劇),(拳擊,拳擊)。讀者可試著檢驗這兩點是否符合納什均衡的定義。
在任何一個博弈中,在有兩個或兩個以上納什均衡點的博弈中,其最後的博弈結果我們難以事先預測。在“夫妻博弈”中,我們無法知道,最後結果是一同欣賞歌劇還是一起去看拳擊。也許因雙方都知道的性格,比如妻子扭不過有大男子主義的丈夫,每次這樣的博弈其結果都是一起去看拳擊;也許因夫妻長期博弈而形成的“習慣”,如“妻管嚴”,每次這樣的博弈其結果都是一起看歌劇。
是不是所有的博弈存在至少一個納什均衡點呢?是的。但納什均衡點不一定是那種純策略納什均衡點——所謂純策略是指參與人在他的策略空間中選取惟一確定的策略,而可能是一個混合策略(mixed strategy)均衡點——所謂混合策略是指參與人採取的不是惟一的策略,而是其策略空間上的一種機率分佈。這就是納什於1950年證明了的納什定理。我們下面將在“警察與小偷的故事”例子中給出混合策略的說明。
在有些博弈中,納什均衡有無窮多個。舉一個例子:兩人分100元錢,若兩人為自己提出的錢數之和不超過100元,即小於或等於100元,則按照所提出的方案來分配,若提出的錢數總和超過100元則兩人均無所得。此時的納什均衡是:兩人為自己提出的分配所得之和為100元。如:(20,80)是一個納什均衡;(30,70)也是一個納什均衡……這樣的均衡有無窮多。之所以“兩人提出的分配之和為100”構成納什均衡,是因為一旦兩人提出的方案滿足這個條件(總和為100元),每個人不會單獨改變方案——若某個人改變方案,他的收益會降低。其他分配方案不能是納什均衡,因為:若分配方案之和小於1