2012/04/25

[法學] 囚犯困境(The Prisoner's Dilemma)

法理學辭典007:囚犯困境(The Prisoner's Dilemma)
導論
博弈理論(game theory)是分析法律規則與決策問題最有效工具之一,其基本觀念很簡單,人和人的許多互動都可以用博弈模型呈現。為使用博弈理論,就要將真實世界模擬成簡單的博弈,所以民事訴訟模擬為原告對抗被告的博弈,參議院聯邦法官任命同意模擬為民主黨與共和黨之間的博弈。本文討論博弈理論中「囚犯困境」重要例子,本文以一年級法理論學生為對象。
一個例子
Ben和Alice因搶劫諾克斯堡(Fort Knox)被捕,關在不同的囚室中,警察分別對他們提出如下條件:「你可以選擇認罪或保持沉默。如果你選擇認罪,同夥選擇沉默,你不會受到任何起訴,而同夥會因你的證詞而受到重罰。如果你同夥認罪,你保持沉默,你同夥將獲得自由而你則會受到重罰。如果兩人都認罪,我會用輕罰起訴你們。如果兩人都保持沉默,我只會象徵性的用持有槍械名義起訴你們。如果你想認罪,就得在明早我來之前在監獄看守人那留下記錄。」表一中,Ben的選擇用水平線代表,Alice選擇用垂直線代表。毎對數字(例如5,0)代表二人的報酬,第一個數字是Alice報酬,第二個數字是Ben報酬,數字越大表示效用越高(報酬越好),5最好,然後是3,然後是1,最差的是0。
表一:囚犯困境的例子
Dp
假設你是Ben,你可能會這樣推論:如果Alice認罪,我只剩兩個選擇,如果我也認罪,會受到輕罰(指定的數值為1),若不認罪,則會受到重罰而報酬為0,所以Alice認罪,我也該認罪(因為1比0好)。如果Alice不認罪,我同樣也只剩兩個選擇,如果我認罪,不會受到任何處罰而報酬為5,如果我也不認罪,我們兩人都只受到輕罰而報酬為3,所以Alice不認罪,我也該認罪(應為5比3好)。因此,不管Alice認罪與否,我都應該認罪。
Alice也會有同樣的推論,所以Ben與Alice最終都會認罪。換言之,博弈中的決策(認罪)主導了博弈參與人的其他決策(不認罪)。但是Ben和Alice所能得到的最佳結果是都不認罪,亦即,對Ben和Alice而言,原本具主導性的決策結果(都認罪)取得的報酬(1,1),比其他決策(都不認罪)報酬(3,3)要差。結果就是發生依照理性計算行為而認罪,Ben和Alice獲得的結果比不按理性行為要差。
真實世界
囚犯困境不僅僅是理論模型,Easterbrook 法官在美國訴赫瑞拉案(United States v. Herrera, 70 F.3d 444, 7th Cir. 1995)中判決意見:
辛西亞˙拉博˙赫瑞拉(Cynthia LaBoy Herrera)活在惡夢當中。她和丈夫杰拉多˙赫瑞拉(Geraldo Herrera)因毒品交易而被捕。調查人員分開囚禁這對夫妻,然後輸了一場囚犯困境博弈。詳見巴德(Douglas G. Baird)、葛特納(Robert H. Gertner)和皮克(Randal C. Picker)1994年發表的〈博弈理論與法律〉(Game Theory and the Law)第312-313頁,佩吉訴美國政府案(Page v. United States, 884 F.2d 300, 7th Cir.1989)。辛西亞告訴調查人員誰是毒品供應商,知道這種情形杰拉多也認罪了。二人在交保釋放時,杰拉多決定讓辛西亞為告密付出代價,他拿槌子槌打辛西亞的後腦,當辛西亞要保護自己,杰拉多卻說她告訴毒品管制局(DEA)太多內情了。當辛西亞抓住揮動槌子的手時,杰拉多用空出來的手痛揍她的臉,原本被抓住的手被鬆開後,杰拉多又用槌子不住的痛擊辛西亞。她最終倒地不醒人事。
溝通與協議
如何避免囚犯困境?讀者可能注意在囚犯困境中,假設兩位囚犯是相互隔離者。這絕非偶然,如果兩位囚犯可以相互溝通,很可能會達成協議。Alice或許會對Ben說:「如果你不認罪,我也不認罪。」Ben可能回答:「同意。」當然,這並未解決囚犯困境問題。為何如此?假如她們同意都不認罪,但各自被帶到隔離房間,分別給他們看一張已經簽名的認罪同意書,Ben可能會做這樣推論:「如果我繼續信守承諾,Alice已經破壞了協議,那她可以獲得自由我會受到重罰。」因此Ben很容易被誘導破壞協議。Alice也會做完全相同推論。另一方面,或許Ben和Alice因其他原因而彼此信賴,例如,為證明彼此值得信賴而進行過事前交易。當然,也可能以其他方式建立起彼此信任。如果確保背叛協議一方必然獲得報復,而報復內容可能像破壞主導合作策略一樣,使得報酬結構因此發生變化。報復情形之一,即在囚犯困境中建立循環的囚犯困境。
循環博弈(Iterated Game)
正如前述,囚犯困境是個一次性的博弈。但在真實世界,囚犯困境可能是不斷的重複。以下列一連串的決策為例:
第一回合:Alice認罪,Ben不認罪。
第二回合:Alice認罪,Ben認罪。
第三回合:Alice不認罪,Ben不認罪。
我們可以想像出Ben和Alice採取的各種不同策略,其中最重要一種是「針鋒相對」(tit for tat),Alice會問自己:「如果Ben認罪,我除了認罪之外還要報復回去;如果Ben不認罪,我也不認罪。」在此策略加入額外因素,假設Ben和Alice都問自己,在第一回合博弈中,我會合作而不認罪。模式如下:
第一回合:Alice不認罪,Ben不認罪。
第二回合:Alice不認罪,Ben不認罪。
第三回合:Alice不認罪,Ben不認罪。
如果這樣,如果Ben和Alice一直「針鋒相對」下去,結果將是一個穩定的合作模式,而Alice和Ben都能因此而獲益。
如果你想對循環囚犯困境有更深刻的感受,可以造訪這個網站,這裡你可以實際採取不同策略。
再舉一個變化型態。假設博弈是有限的,亦即博弈回合數有限,例如10個回合。Ben和Alice如何玩「有限博弈」(end game)?Ben可能這樣推論:如果我在第十回合違反協議認罪,Alice不能在第11回合中報復我了(因為沒有第11回合)。而Alice也會有相同推論,這會使Alice和Ben二人都在最終回合時認罪。但是Ben也可能有其他想法,既然在第10回合背叛對方對我們二人來說都是合理的,那我就要重新思考我在第9回合採取的策略,既然我知道Alice一定會在第10回合認罪,我就得在第9回合認罪。再一次的,Alice也會有完全相同念頭。勿庸言之,Alice和Ben二人都決定在第一回合就要背叛對方了。
結論
本文是對囚犯困境最基本的介紹,希望讀者能藉此文能掌握到其基本概念。法學院一年級學生,遲早會碰到囚犯困境問題。如果對法理論中這類的途徑深感興趣,這裡也提供了一些更深入的參考資料。預祝建構模型快樂。



No comments: