
談博弈就必須從囚徒困境談起,囚徒困境是我們每個人都會在生活中碰到的,如何解決囚徒困境,如何讓博弈的最終利益最大化,值得我們探討和思考。
為什麼會互相背叛
囚徒困境反映了個人理性和集體理性的矛盾。
在生活中,不乏有很多囚徒困境的例子。比如有這樣一個經典的故事:
兩個旅行者麥克和約翰從一個以出產瓷器的著名旅遊勝地回來時,他們各買了一個瓷花瓶。提取行李時,發現花瓶被打破了。他們向航空公司索賠。
航空公司估計花瓶的價格在八九十元左右,但不知道這兩位旅客購買的準確價格。航空公司要求兩位旅客在100元以內自己寫下花瓶價格。若兩人所寫的相同,說明他們說了真話,就照他們寫的數額賠償;如果兩人所寫的不一樣,那就認定寫得低的旅客講的是真話,按這個低的價格賠償,但是對講真話的旅客獎勵2元錢,對講假話的旅客罰款2元。
如果兩人都寫100元,他們都會獲得100元。但是,給定約翰寫100元,麥克改寫99元,則他會獲得101元。約翰又想,若麥克寫99元,他自己寫98元,比寫100元好,因為這樣他獲100元,而自己寫100元,當麥克寫99元時自己卻隻獲97元。而給定約翰寫98元,麥克又會寫97元……這樣,最後落得兩個人隻寫1元的境地。
雙輸,這往往就是囚徒困境帶來的結果。
再有,一個小鎮政府有一個為期一年的采購計劃,每個月采購一批飲料。如果小鎮上的兩家飲料公司的報價一致,那麼政府就把訂單一分為二。否則,政府會把更多的訂單給報價低的那個公司。顯然,這兩家公司都報出同樣的高價,才符合其利益。在這種多次博弈中,他們會聯合起來出高價嗎?如果會,那麼在一年12次的博弈中他們會合作幾次呢?
假如他們開始簽訂了合約,都報出一個比較高的價位。不過,顯然最後一次他們不需要遵守合約,因為反正以後沒有采購計劃了,違約也不會有什麼壞處。如果是這樣,倒數第二次也不需要遵守合約,因為不論怎樣倒數第一次都是要違約的,那就不存在是否有懲罰的問題。所以倒推下來,一次合約都不用遵守。兩家公司最後可能還是兩敗俱傷。
如果你有興趣,還可以做一個實驗:選定幾個人,讓他們都猜一個數字,必須是1~100的整數。條件是誰最接近所有實驗者的所猜數字平均值的1/3,誰就可以得到100塊錢。
這個時候,每個人都會想:如果一開始其他人都是隨機地選擇數字,50就會是所有人的猜測。這個時候,猜50的1/3也就是大約17可能會贏。然而,每個人都會猜到17這個數字的時候,大家就會猜測17的1/3,也就是6左右。依次類推,這個遊戲中的每一個人最終猜測的結果是唯一最小的數字,那就是1。
囚徒困境反映了個人理性和集體理性的矛盾。如果甲和乙都選擇抵賴,各判刑1年,顯然比都選擇坦白各判刑10年好得多。當然,甲和乙可以在被警察抓到之前訂立一個“攻守同盟”,但是這可能不會有用,因為它不構成納什均衡,沒有人有積極性遵守這個協定。
因為這種協商,並不會影響他們在被審訊的時候所做的決策。雖然有了協議,但乙還是不敢確信甲是否會出賣自己,並且不論甲是否背叛協約,出賣對方肯定是有好處的。反過來甲是這麼想的,所以到最後他倆還是會同時出賣對方。