
兩信封悖論的求解方法
劉 博 劉維奇
摘要:介紹了兩信封悖論,詳述了幾種主要的求解方法,最后著重對所述方法作了進一步的比較和分析。
關鍵字: 兩信封悖論 概率測度 期望 無差異原理 博弈論
兩信封悖論的問題由來已久,它涉及概率論、博弈論、經濟學等很多方面。尋找這個問題的解決辦法的同時,人們又發現了許多新的實際問題,這些問題與兩個信封悖論極其相似,或者與兩信封悖論的解決遇到了相同的問題。大量學者提出許多對這個問題的解釋或看法,但是沒有一種得到廣泛的認同。到目前為止這個悖論仍沒有被徹底解決。本文期待總結分析現有幾種主要方法的優缺異同,能夠推進這個問題的解決進程。
1.兩信封悖論簡介
兩信封悖論有很多不同的表述形式。下面給出最常見的一種。
假定有兩個外表一樣的信封,主持人將一筆隨機數量的錢放在一個信封中。拋擲一枚硬幣,若正面朝上,則將兩倍于這個信封里的錢放入另一信封中;否則放入另一信封中的錢數為第一個信封中錢數的一半。這樣兩個信封都裝有錢,其中一個信封里裝的錢數是另一個信封里錢數的兩倍,但是并不知道是哪一個。
一個參與者加入這個游戲,他在兩個信封之間任意選擇一個,所選信封中錢將歸他所有。打開信封之前他有機會來決定是否要改變主意,即是否轉而選擇另外一個。參與者總是想使自己的利益(錢數)盡可能的大,假設所選信封甲中的錢數為x,則另一信封乙中的錢數等可能的是2x或x/2,其期望值為1/2?2x+1/2?x/2=1.25x,即乙信封中錢數的期望是甲中錢數的1.25倍。因此他應該選擇交換乙信封,以獲得更大的錢數期望。但是這種考慮顯然是有問題的,因為如果在交換到乙信封之后,再給他改變主意的機會,依據同樣的推理,甲信封中的錢數期望也會是乙信封中錢數的1.25倍,他還是會選擇交換信封的策略以使自己的利益最大。 如果一直給他重新選擇的機會,他會一直交換下去。由于這種情況對兩個信封是對稱的,因此也有觀點認為換與不換無所謂。
問題出在哪里呢?
這就是兩信封悖論的標準描述。Kraitchik 在1943年討論的領帶悖論和他構造的錢包游戲,都是和兩信封悖論實質相同的問題[1]。
本文接下來將介紹幾種對這個悖論的主要觀點和解釋。在第三部分對這些方法進行分析比較,并提出作者的一些看法。
2.兩信封悖論的幾種主要解釋
(1)概率測度方法[2]
此方法的核心是建立一種基于自然數集N上的概率測度,利用所建立的概率測度的有限可加性來計算信封中錢數的期望值,對于錢數定義域即自然數集的無限性,采用了對上述的計算值取極限的辦法。
設集合且,定義勢;定義的概率測度(又稱漸近密度)為,若此極限存在。
易見如果,則對所有的成立。
具有性質:,為空集;==0,其中;=1;=0,若。
直觀意義上講P應由一個均勻分布決定。雖然有限集的測度為0,但是這個結論的逆并不成立。例如對,由,有P(A)=0成立。
上述定義的概率測度具有如下性質:
(i) 有限可加性。
(ii) 平移不變性。
(iii) 可以構造集合,使得對任意成立。
(iv) 上面所建立的概率測度并不完善,可以構造一個集合,使其在所定義的概率測度意義上不可測。
形式地計算兩信封中錢數的期望值:
這是因為所建立的概率測度沒有無限可加性質。為避開這個問題,可以先計算一個累積的期望,然后取極限,得到期望值:
兩信封中的錢數均為無限期望值,就沒有矛盾的推理了(因為E(A)與E(B)均為無限,E(A)=1.25E(B)與E(B)=1.25E(A)可以同時成立)。
(2)概率密度函數解釋[3]
將正實數集作為信封中錢數的定義域來討論,并且不考慮實際情況中存在著的錢數的上限(有關錢數有限時的情形,可以推論到合理的結果,悖論的情況并不出現,見[4])。
假設信封中錢數服從于某一概率分布。定義兩信封中較小的錢數Z的概率密度函數為g(x),則Z落于區間[a ,b]的概率為。則兩種情況A=2Z,B=Z與A=Z,B=2Z出現的概率相同。直觀上看,由于只知道Z的取值范圍,很容易認為它是服從無限區間的均勻分布的變量。但是這是不可能的。
假設概率密度函數g(n)為正實數域上的平均函數,則對任意的正整數k有成立,其中為一常數。如果c=0,g(n)在其積分區域內的積分值為;如果,則在積分區域內的積分值為正無窮。同時,每個適定(proper)的分布必定收斂的事實也從一個方面反映了實數集上的平均分布的不可能性。
可以證明存在能夠導致悖論中的矛盾推理的適定(proper)的概率分布。得出。
若A(代表信封中錢數)的取值范圍為:,則的范圍或者是或者是,根據概率測度概念,第一種情況的概率應該是,第二種情況的概率應該是,因此B>A的概率與B<A的概率之比為。
不存在無限集上的平均分布,轉向尋找概率密度函數為減函數的隨機變量,以便使得對所有的有P(B>A|A=n)=0.5成立。上述情況可以定義函數g(n)滿足。例如:g(x)=1/x ,分別取上下界U,L后規范化(normalize)使得成立。此時對所有滿足的n ,有P(B>A|A=n)=0.5成立。
一般情況下分布函數的界會限制(block)矛盾的推理;而且無界(unbounded)的分布函數g(x)=1/x有無限積分。因此上述有界的分布不會導致悖論的情況出現。
可以修改這個分布函數,使它更快的收斂以解決這個問題。比如定義分布函數為,在取下界L處截斷后標準化(normalized),使得悖論出現。這個分布有有限積分,而且既使對絕大多數的,P(B|A=n)<0.5,仍然對所有的,有E(B|A=n)>n。事實上如果,;如果,因為:
==。因此悖論仍然存在。
也可以構造類似的更符合直覺的概率分布:設隨機變量落在區間(1,2)的概率為,落在區間(2,4)的概率為0.9c,落在區間(4,8)的概率為0.81c,……以此類推。這個分布有有限積分(即是適定(proper)的分布),與選擇變量值落在與之間的概率是常數的情況相比,兩種情況十分相似的,矛盾的推理仍然成立。由此可以證明能夠導致悖論中矛盾推理(即:E(A)=1.25E(B),E(B)=1.25E(A))的適定(proper)概率分布存在。
根據適定的概率分布所具有的性質,上述分布都具有有限的積分值,但是這些概率分布仍然可以具有無限的期望值(比如當時,期望值無限)。當期望值是無限的時候,類似上面的方法(1),悖論解決。
為了完全解釋這個悖論,只需證明在有限期望的情況下沒有悖論存在。為此需要更精確的描述矛盾狀態下的條件。問題的表述中,當對所有的nN,有E(B|A=n)>n成立時,矛盾情況出現。關于依賴于的推理使我們得到結論:在平均情況(而不是任何情況)下,通過用換,是有期望利益存在的,這時矛盾情況仍出現。用K表示隨機變量E(B|A=x),當E(K-A)>0時這個結論仍然成立。因此需證明當E(A)有限時,E(K-A)=0。
定義函數h為A的概率密度函數:=。注意。
上述推導只有在的值為有限的時候才有意義。此時E(A)有限,由B對A的依賴,不會得出應該交換信封的結論。
所以如果當E(A)有限時,對所有的n 有E(B|A=n)>n是不可能的,此時悖論不會出現。而如果E(A)無限,可能有E(A) =E(K),且均為無限。這種情況下,矛盾的推理仍然存在。但結果不再是悖論,僅僅是與人們的直覺不相符合。
(3)博弈論觀點[5]
引入另一個相關的悖論,稱之為猜數游戲(不妨計為悖論Ⅱ,兩信封悖論計為悖論Ⅰ):兩張紙片上均寫有一實數,數字朝下放在桌面上。甲隨機選擇其中的一張,告訴乙上面的數字,由乙來猜另外一張紙上數字與這個數字之間的大小關系。
利用悖論Ⅱ的解決給了悖論Ⅰ的一種不同的解釋。即不存在具有如下性質的概率分布:該分布使得一對數a,b等可能的互為大數,且對其中任一數的觀察不會改變這種等可能性。延伸到悖論Ⅰ中:服從對任一信封中的隨機錢數x ,另一信封中的錢數等可能的為2x和x/2性質的概率分布是不存在的。即兩信封悖論中所描述的情況不存在。
定義隨機變量X1,X2分別表示第一、二個信封中的錢數。由兩信封悖論的描述可以知道,對任意X1的觀察值x1,有
;
成立。
這表明對任意可測數集A有:
;
。
在分析中,可以把事件X1=2X2,X1=0.5X2分別等同于事件X1> X2,X2> X1。
因此有下述兩個條件成立:
(i)
(ii)
即事件X2> X1,X1> X2的概率均為1/2,且這兩個事件與X1,X2獨立。
命題1:不可能有一對隨機變量X1,X2滿足上述條件(i)、(ii)。
悖論Ⅱ可看作是一個雙人游戲:參與者C選擇兩個數字分別寫在兩個紙片上,參與者G在看過從其中隨機選擇的一個紙片之后,猜測這兩個紙片上的數字的相對大小。若猜對,則G獲勝。
這里假定G采用門限策略(threshold strategy) T:G任意選擇一個實數T,當他所看到的數字不小于T時,認為這個數是兩個數字中的大數;否則認為是較小的數。
命題2:如果不論C采取何種純策略, G都采取門限策略T,那么G獲勝的概率為1/2,當或的時候;獲勝的概率為1,當或者的時候。
如果G采用一個混合策略,即對任意,概率。
命題3:G采取策略Q將保證獲勝的概率過半,不論C采取何種純策略。
證明:設,如果,;否則,。
因此。
時的情況類似。證畢。
上述命題3可以用來證明命題1:假設C采用的混合策略(x1,x2)滿足條件(i),(ii),那么G將不能保證他以過半的概率猜對,推出矛盾。
G用門限策略T時獲勝的概率為:
因此混合策略(x1, x2)使得無論G采取何種門限策略(當然包括Q),他獲勝的概率為1/2,與命題3相矛盾。因此假設不成立,命題1得證。
(4)無差異原則(principle of indifference)的觀點[6]
關于一個問題的各種不同的推理并不相互矛盾,因為不同的推理所依據的具體的操作或描述的過程并不相同,同一個策略所對應的狀態空間也不同。言外之意若無足夠信息支持在多種不同分布間作出理性偏好,我們沒有理由堅持換或者不換。
關于兩信封悖論,如果沒有其他的信息的話,問題得不到很好的解決。為了說明這種觀點,有人專門將信封悖論的不同操作過程分別開來加以討論,以適應對兩信封悖論的不同推理。這種解釋方法不僅適用于兩個信封悖論,對其他的問題也成立。比如貝特朗悖論(
Bertrand’s Paradox)。