半生不熟的法律: [法學] 囚犯困境（The Prisoner's Dilemma）

法理學辭典007：囚犯困境（The Prisoner's Dilemma）
導論
博弈理論（game theory）是分析法律規則與決策問題最有效工具之一，其基本觀念很簡單，人和人的許多互動都可以用博弈模型呈現。為使用博弈理論，就要將真實世界模擬成簡單的博弈，所以民事訴訟模擬為原告對抗被告的博弈，參議院聯邦法官任命同意模擬為民主黨與共和黨之間的博弈。本文討論博弈理論中「囚犯困境」重要例子，本文以一年級法理論學生為對象。
一個例子
Ben和Alice因搶劫諾克斯堡（Fort Knox）被捕，關在不同的囚室中，警察分別對他們提出如下條件：「你可以選擇認罪或保持沉默。如果你選擇認罪，同夥選擇沉默，你不會受到任何起訴，而同夥會因你的證詞而受到重罰。如果你同夥認罪，你保持沉默，你同夥將獲得自由而你則會受到重罰。如果兩人都認罪，我會用輕罰起訴你們。如果兩人都保持沉默，我只會象徵性的用持有槍械名義起訴你們。如果你想認罪，就得在明早我來之前在監獄看守人那留下記錄。」表一中，Ben的選擇用水平線代表，Alice選擇用垂直線代表。毎對數字（例如5,0）代表二人的報酬，第一個數字是Alice報酬，第二個數字是Ben報酬，數字越大表示效用越高（報酬越好），5最好，然後是3，然後是1，最差的是0。
表一：囚犯困境的例子

假設你是Ben，你可能會這樣推論：如果Alice認罪，我只剩兩個選擇，如果我也認罪，會受到輕罰（指定的數值為1），若不認罪，則會受到重罰而報酬為0，所以Alice認罪，我也該認罪（因為1比0好）。如果Alice不認罪，我同樣也只剩兩個選擇，如果我認罪，不會受到任何處罰而報酬為5，如果我也不認罪，我們兩人都只受到輕罰而報酬為3，所以Alice不認罪，我也該認罪（應為5比3好）。因此，不管Alice認罪與否，我都應該認罪。
Alice也會有同樣的推論，所以Ben與Alice最終都會認罪。換言之，博弈中的決策（認罪）主導了博弈參與人的其他決策（不認罪）。但是Ben和Alice所能得到的最佳結果是都不認罪，亦即，對Ben和Alice而言，原本具主導性的決策結果（都認罪）取得的報酬（1,1），比其他決策（都不認罪）報酬（3,3）要差。結果就是發生依照理性計算行為而認罪，Ben和Alice獲得的結果比不按理性行為要差。
真實世界
囚犯困境不僅僅是理論模型，Easterbrook 法官在美國訴赫瑞拉案（United States v. Herrera, 70 F.3d 444, 7th Cir. 1995）中判決意見：

辛西亞˙拉博˙赫瑞拉（Cynthia LaBoy Herrera）活在惡夢當中。她和丈夫杰拉多˙赫瑞拉（Geraldo Herrera）因毒品交易而被捕。調查人員分開囚禁這對夫妻，然後輸了一場囚犯困境博弈。詳見巴德（Douglas G. Baird）、葛特納（Robert H. Gertner）和皮克（Randal C. Picker）1994年發表的〈博弈理論與法律〉（Game Theory and the Law）第312-313頁，佩吉訴美國政府案（Page v. United States, 884 F.2d 300, 7th Cir.1989）。辛西亞告訴調查人員誰是毒品供應商，知道這種情形杰拉多也認罪了。二人在交保釋放時，杰拉多決定讓辛西亞為告密付出代價，他拿槌子槌打辛西亞的後腦，當辛西亞要保護自己，杰拉多卻說她告訴毒品管制局（DEA）太多內情了。當辛西亞抓住揮動槌子的手時，杰拉多用空出來的手痛揍她的臉，原本被抓住的手被鬆開後，杰拉多又用槌子不住的痛擊辛西亞。她最終倒地不醒人事。

溝通與協議
如何避免囚犯困境？讀者可能注意在囚犯困境中，假設兩位囚犯是相互隔離者。這絕非偶然，如果兩位囚犯可以相互溝通，很可能會達成協議。Alice或許會對Ben說：「如果你不認罪，我也不認罪。」Ben可能回答：「同意。」當然，這並未解決囚犯困境問題。為何如此？假如她們同意都不認罪，但各自被帶到隔離房間，分別給他們看一張已經簽名的認罪同意書，Ben可能會做這樣推論：「如果我繼續信守承諾，Alice已經破壞了協議，那她可以獲得自由我會受到重罰。」因此Ben很容易被誘導破壞協議。Alice也會做完全相同推論。另一方面，或許Ben和Alice因其他原因而彼此信賴，例如，為證明彼此值得信賴而進行過事前交易。當然，也可能以其他方式建立起彼此信任。如果確保背叛協議一方必然獲得報復，而報復內容可能像破壞主導合作策略一樣，使得報酬結構因此發生變化。報復情形之一，即在囚犯困境中建立循環的囚犯困境。
循環博弈（Iterated Game）
正如前述，囚犯困境是個一次性的博弈。但在真實世界，囚犯困境可能是不斷的重複。以下列一連串的決策為例：
第一回合：Alice認罪，Ben不認罪。
第二回合：Alice認罪，Ben認罪。
第三回合：Alice不認罪，Ben不認罪。
我們可以想像出Ben和Alice採取的各種不同策略，其中最重要一種是「針鋒相對」（tit for tat），Alice會問自己：「如果Ben認罪，我除了認罪之外還要報復回去；如果Ben不認罪，我也不認罪。」在此策略加入額外因素，假設Ben和Alice都問自己，在第一回合博弈中，我會合作而不認罪。模式如下：
第一回合：Alice不認罪，Ben不認罪。
第二回合：Alice不認罪，Ben不認罪。
第三回合：Alice不認罪，Ben不認罪。
如果這樣，如果Ben和Alice一直「針鋒相對」下去，結果將是一個穩定的合作模式，而Alice和Ben都能因此而獲益。
如果你想對循環囚犯困境有更深刻的感受，可以造訪這個網站，這裡你可以實際採取不同策略。
再舉一個變化型態。假設博弈是有限的，亦即博弈回合數有限，例如10個回合。Ben和Alice如何玩「有限博弈」（end game）？Ben可能這樣推論：如果我在第十回合違反協議認罪，Alice不能在第11回合中報復我了（因為沒有第11回合）。而Alice也會有相同推論，這會使Alice和Ben二人都在最終回合時認罪。但是Ben也可能有其他想法，既然在第10回合背叛對方對我們二人來說都是合理的，那我就要重新思考我在第9回合採取的策略，既然我知道Alice一定會在第10回合認罪，我就得在第9回合認罪。再一次的，Alice也會有完全相同念頭。勿庸言之，Alice和Ben二人都決定在第一回合就要背叛對方了。
結論
本文是對囚犯困境最基本的介紹，希望讀者能藉此文能掌握到其基本概念。法學院一年級學生，遲早會碰到囚犯困境問題。如果對法理論中這類的途徑深感興趣，這裡也提供了一些更深入的參考資料。預祝建構模型快樂。

半生不熟的法律

2012/04/25

[法學] 囚犯困境（The Prisoner's Dilemma）

No comments: