
博 弈 論
判斷題(每小題1分,共15分)
囚徒困境說明個(gè)人的理性選擇不一定是集體的理性選擇。(√ )
子博弈精煉納什均衡不是一個(gè)納什均衡。(× )
衡。(√ )
多個(gè)純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈子博弈完美納什均衡路徑:
兩階段都采用原博弈同一個(gè)純戰(zhàn)略納什均衡,或者輪流采用不同純戰(zhàn)略
納什均衡,或者兩次都采用混合戰(zhàn)略納什均衡,或者混合戰(zhàn)略和純戰(zhàn)略
分)
參與人(player)
即各博弈方同時(shí)決策,且所有博弈方對各方得益都了解的博弈。
上策:
不管其它博弈方選擇什么策略,一博弈方的某個(gè)策略給他帶來的得
益始終高于其它的策略,至少不低于其他策略的策略
上策均衡:
一個(gè)博弈的某個(gè)策略組合中的所有策略都是各個(gè)博弈方各自的上策,
必然是該博弈比較穩(wěn)定的結(jié)果
嚴(yán)格下策:
階段博弈
重復(fù)博弈中的每次博弈稱為“階段博弈”。
貼現(xiàn)因子
下一期的一單位支付在這一期的價(jià)值。
觸發(fā)戰(zhàn)略(Trigger Strategy)
首先試探合作,一旦發(fā)現(xiàn)對方不合作,則也用不合作相報(bào)
復(fù)的戰(zhàn)略。
子博弈精煉納什均衡
(夫妻博弈) 一對新婚夫妻為晚上看什么電視節(jié)目爭執(zhí)不下,丈夫
(記為I方)要看足球比賽節(jié)目,而妻子(記為Ⅱ方)要看戲曲節(jié)目.他
求納什均衡。
博弈的穩(wěn)定狀態(tài)有兩個(gè):都不漲價(jià)或者都漲價(jià)(均衡),均衡稱為博弈
的解。
3、豬圈里有一頭大豬和一頭小豬,豬圈的一頭有一個(gè)飼料槽,另一頭
裝有控制飼料供應(yīng)的按鈕。按一下按鈕就會有10個(gè)單位飼料進(jìn)槽,但誰
按誰就要付出2個(gè)單位的成本。誰去按按紐則誰后到;都去按則同時(shí)
到。若大豬先到,大豬吃到9個(gè)單位,小豬吃到一個(gè)單位;若同時(shí)到,
大豬吃7個(gè)單位,小豬吃3個(gè)單位;若小豬先到,大豬吃六個(gè)單位,小豬
吃4個(gè)單位。各種情況組合扣除成本后的支付矩陣可如下表示(每格第
一個(gè)數(shù)字是大豬的得益,第二個(gè)數(shù)字是小豬的得益):
小豬
按 等待
(2)Pure NE (A, a); (B, b)
都是Pareto有效,僅(B, b)是K-H有效。
(3)Mixed NE ((2/5, 3/5); (2/3, 1/3))
5、用反應(yīng)函數(shù)法求出下列博弈的所有純戰(zhàn)略納什均衡。
參與人
2
bacd
2,33,23,40,3
4,45,20,11,2
3,14,11,410,2
3,14,1-1,210,1
A
B參與
C
D
人1
解答:
者)選擇是否與新企業(yè)展開競爭。在位者可能有兩種類型,溫柔型(左
圖)和殘酷型(右圖),回答下面問題。
.
進(jìn)入者
在位者
進(jìn)入
不進(jìn)入
默許
斗爭
(20,30)
(-10,0)
(0,100)
進(jìn)入者
在位者
進(jìn)入
不進(jìn)入
默許
斗爭
(-10,25)
(0,100)
(10,20)
9、北方航空公司和新華航空公司分享了從北京到南方冬天度假勝地的
市場。如果它們合作,各獲得500000元的壟斷利潤,但不受限制的競爭
會使每一方的利潤降至60000元。如果一方在價(jià)格決策方面選擇合作而
另一方卻選擇降低價(jià)格,則合作的廠商獲利將為零,競爭廠商將獲利
900000元。
(1)將這一市場用囚徒困境的博弈加以表示。
(2)解釋為什么均衡結(jié)果可能是兩家公司都選擇競爭性策略。
答:(1)用囚徒困境的博弈表示如下表:
北方航空公司
合作競爭
新華航空公司
合作500000,5000000,900000
售中,A企業(yè)可以獲得20萬元利潤,B企業(yè)可獲得8萬元利潤;若A企業(yè)做
廣告,B企業(yè)不做廣告,A企業(yè)可獲得25萬元利潤,B企業(yè)可獲得2萬元利
潤;若A企業(yè)不做廣告,B企業(yè)做廣告,A企業(yè)可獲得10萬元利潤,B企業(yè)
可獲得12萬元利潤;若A、B兩企業(yè)都不做廣告,A企業(yè)可獲得30萬元利
潤,B企業(yè)可獲得6萬元利潤。
(1)畫出A、B兩企業(yè)的支付矩陣。
(2)求納什均衡。
3. 答:(1)由題目中所提供的信息,可畫出A、B兩企業(yè)的支付矩
陣(如下表)。
B企業(yè)
做廣告不做廣告
A企業(yè)
做廣告20,825,2
不做廣告10,1230,6
(2)因?yàn)檫@是一個(gè)簡單的完全信息靜態(tài)博弈,對于純策納什均衡
解可運(yùn)用劃橫線法求解。
如果A廠商做廣告,則B廠商的最優(yōu)選擇是做廣告,因?yàn)樽鰪V告所獲
得的利潤8大于不做廣告獲得的利潤2,故在8下面劃一橫線。如果A廠商
由劃線法易知,該矩陣博弈沒有純策略Nash均衡。
可得如下不等式組
Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1
可得混合策略Nash均衡((),()
16、 某產(chǎn)品市場上有兩個(gè)廠商,各自都可以選擇高質(zhì)量,還是低質(zhì)
量。相應(yīng)的利潤由如下得益矩陣給出:
(1) 該博弈是否存在納什均衡?如果存在的話,哪些結(jié)果是納什均衡?
參考答案:
由劃線法可知,該矩陣博弈有兩個(gè)純策略Nash均衡,即(低質(zhì)量, 高質(zhì)
量), (高質(zhì)量,低質(zhì)量)。
乙企業(yè)
高質(zhì)量低質(zhì)量
50,50100,800質(zhì)
甲
企
業(yè)
發(fā)
解:用劃線法找出問題的純策略納什均衡點(diǎn)。
所以可知該問題有兩個(gè)純策略納什均衡點(diǎn)(開發(fā),不開發(fā))和(不開發(fā),開
發(fā))。
該博弈還有一個(gè)混合的納什均衡((),())。
如果乙企業(yè)所在國政府對企業(yè)開發(fā)新產(chǎn)品補(bǔ)貼a個(gè)單位,則收益矩陣變
為:,要使(不開發(fā),開發(fā))成為該博弈的唯一納什均衡點(diǎn),只需a>10。此
時(shí)乙企業(yè)的收益為100+a。
18、博弈的收益矩陣如下表:
(1)列出收益矩陣。
(2)如果參與者以1/3的概率選擇每一個(gè)數(shù)字,證明該混合策略存
在一個(gè)納什均衡,它為多少?
答:(1)此博弈的收益矩陣如下表。該博弈是零和博弈,無納什
均衡。
John
123
13,-3-1,1-1,1
Smith2-1,13,-3-1,1
3-1,1-1,13,-3
對壟斷企業(yè)2來說:
這是壟斷企業(yè)2的反應(yīng)函數(shù)。
其等利潤曲線為:
在達(dá)到均衡時(shí),有:
均衡時(shí)的價(jià)格為:
兩壟斷企業(yè)的利潤分別為:
均衡點(diǎn)可圖示為:
0
企業(yè)1
95
200
190
企業(yè)2
企業(yè)1的反應(yīng)線
均衡點(diǎn)
(2)當(dāng)壟斷企業(yè)1為領(lǐng)導(dǎo)者時(shí),企業(yè)2視企業(yè)1的產(chǎn)量為既定,其反
應(yīng)函數(shù)為:
則企業(yè)1的問題可簡化為:
均衡時(shí)價(jià)格為:
利潤為:,
答:該博弈分為兩個(gè)階段,第一階段企業(yè)1選擇產(chǎn)量q,第二階段企業(yè)2
1
和3觀測到q后,他們之間作一完全信息的靜態(tài)博弈。我們按照逆向遞
1
歸法對博弈進(jìn)行求解。
(1)假設(shè)企業(yè)1已選定產(chǎn)量q,先進(jìn)行第二階段的計(jì)算。設(shè)企業(yè)2,3的
1
利潤函數(shù)分別為:
由于兩企業(yè)均要追求利潤最大,故對以上兩式分別求一階條件:
(1)
(2)
求解(1)、(2)組成的方程組有:
(3)
(2)現(xiàn)進(jìn)行第一階段的博弈分析:
對與企業(yè)1,其利潤函數(shù)為;
將(3)代入可得:
(4)
式(4)對q求導(dǎo):
1
益矩陣或擴(kuò)展形表示
該博弈并作簡單分析。
(2)如果老板無法看出工人是否偷懶,博弈屬于哪種類型?用得益矩
陣或擴(kuò)展形表示該博
弈并作簡單分析。
(1)完全信息動態(tài)博弈。
前進(jìn)停下
甲
2,0前進(jìn)-2,-2
0,0停下0,2
28、給定兩家釀酒企業(yè)A、B的收益矩陣如下表:
A企業(yè)
白酒啤酒
B企業(yè)
白酒700,600900,1000
啤酒800,900600,800
(2)分析混合策略納什均衡。
答:(1)該博弈的支付矩陣如下表:
納稅人
逃稅不逃稅
稅收機(jī)關(guān)
檢查A-C+F, -A-FA-C,-A
不檢查0,0A,-A
(2)先分析稅收檢查邊際:因?yàn)镾為稅務(wù)機(jī)關(guān)檢查的概率,E為納
32、簡要評論博弈論在微觀經(jīng)濟(jì)學(xué)運(yùn)用中的優(yōu)缺點(diǎn)。
答:博弈論是描述和研究行為者之間策略相互依存和相互作用的一
種決策理論。它被廣泛應(yīng)用于政治、外交、軍事、經(jīng)濟(jì)等研究領(lǐng)域,但
在微觀經(jīng)濟(jì)學(xué)中的應(yīng)用是最成功的。博弈論的研究方法和特征與經(jīng)濟(jì)學(xué)
結(jié)合得非常緊密。它強(qiáng)調(diào)個(gè)人理性,即在給定的約束條件下追求效用最
大化。但博弈論又比傳統(tǒng)的經(jīng)濟(jì)學(xué)更進(jìn)一步,它研究的不是面臨非人格
化的價(jià)格參數(shù)下的決策問題,而是研究效用隨各個(gè)主體的行為改變而改
變的效用最大化問題。除了國際貿(mào)易、金融、拍賣等經(jīng)濟(jì)領(lǐng)域,博弈論
在企業(yè)理論特別是寡頭競爭研究方法方面做了大量的有益工作。
20世紀(jì)80年代以來,博弈論開始出現(xiàn)在西方經(jīng)濟(jì)學(xué)的教科書中,都
解釋并討論此例的納斯均衡,為什么其均衡是一種囚徒困境。
廠商1的總收益TR由下式給出:
1
廠商1的邊際收益MR為:
1
MR=30-2Q-Q
112
利用利潤最大化條件MR=MC=0,得廠商1的反應(yīng)函數(shù)(reaction
11
function)或反應(yīng)曲線為:
Q=15-0.5Q (6-1)
12
同理可得廠商2的反應(yīng)曲線為:
Q=15-0.5Q (6-2)
21
均衡產(chǎn)量水平就是兩反應(yīng)曲線交點(diǎn)Q和Q的值,即方程組6-1和6-2的
12
解。可以求得古諾均衡時(shí)的均衡產(chǎn)量水平為:Q=Q=10。
12
因此,在本例中,兩個(gè)寡頭的總產(chǎn)量Q為Q+Q=20,均衡價(jià)格為P=30-
12
Q=10。
剛才我們討論了兩寡頭廠商相互競爭時(shí)的均衡產(chǎn)量。現(xiàn)在我們放松
第(6)條不能串謀的假設(shè),假定兩寡頭可以串謀。它們能共同確定產(chǎn)量
以使總利潤最大化。
這時(shí),兩廠商的總收益TR為:
TR=PQ=(30-Q)Q=30Q-Q
2
其邊際收益MR為:
MR=30-2Q
根據(jù)利潤最大化條件MR=MC=0,可以求得當(dāng)Q=15時(shí)總利潤最大。如果兩
廠商同意平分利潤,每個(gè)寡頭廠商將各生產(chǎn)總產(chǎn)量的一半,即
Q=Q=7.5。其實(shí),任何相加為15的產(chǎn)量Q和Q的組合都使總利潤最大
1212
化,因此,把Q+Q=15稱為契約曲線,而Q=Q=7.5是契約曲線上的一個(gè)
1212
點(diǎn)。
我們還可以求得當(dāng)價(jià)格等于邊際成本時(shí),Q=Q=15,各廠商的利潤為
12
零。
35、兩家電視臺競爭周末黃金時(shí)段晚8點(diǎn)到10點(diǎn)的收視率,可選擇把較
好的節(jié)目放在前面還是后面。他們決策的不同組合導(dǎo)致收視率如下:
(1)如果兩家是同時(shí)決策,有納什均衡嗎?
有(前面,后面)
(2)如果雙方采用規(guī)避風(fēng)險(xiǎn)的策略,均衡的結(jié)果是什么?
(4)如果兩家談判合作,電視臺1許諾將好節(jié)目放在前面,這許諾可信
嗎?結(jié)果能是什么?
電視臺1 許諾將好節(jié)目放在前面的許諾不可信。
因?yàn)殡娨暸_2,前面為占優(yōu)策略,
而在電視臺2 ,選擇前面的時(shí)候,電視臺1 選擇后面的收益要大于前面
的收益。
所以,最終結(jié)果為(前面,后面)
36、如果將如下的囚徒困境博弈重復(fù)進(jìn)行無窮次,懲罰機(jī)制為觸發(fā)策
略,貼現(xiàn)因子為δ。試問δ應(yīng)滿足什么條件,才存在子博弈完美納什均
衡?
乙坦不坦
甲白白
坦白4,40,5
不坦5,01,1
白
P=a-Q
TR=P*Q=(a-Q)*Q
MR=a-2Q
因?yàn)椋篗R=MC
a-2Q=c
則:Q=(a-c)/2
P=(a+c)/2
π=(P-c)*Q=(a-c)2/4
每家企業(yè)的利潤為(a-c)2/4n
(2)假設(shè)A企業(yè)自主降價(jià),雖然只是微小的價(jià)格調(diào)整,但足以占領(lǐng)整個(gè)
試求 (a)該廠商的AC,MC及VMP各為多少?
LLL
(b)勞動工資為多少?廠商會雇用多少勞動?
由:S=D解得:W=280
LL
由于產(chǎn)品市場為完全競爭市場,且要素市場也為完全競爭市場
所以,滿足:產(chǎn)品市場均衡:P=MR=MC=W/MP
L
要素市場均衡:W= AC=MC=VMP
LLL
得到:AC=MC=VMP=280
LLL
由:D=S解得:P= 40,q=10
廠商追求利潤最大化的情況下:
W*=VMPL=P*MPL=P*50/L
0.5
L*=[100/2*PW*]=51 (取整數(shù))
2
論述題(每小題20分,共20分)
解釋“囚犯困境”,并舉商業(yè)案例說明。
囚徒困境是博弈論里最著名的例子之一,幾乎所有的博弈論著作中
都要討論這個(gè)例子。這個(gè)例子是這樣的:兩囚徒被指控是一宗罪案的同
案犯。他們被分別關(guān)在不同的牢房無法互通信息。各囚徒都被要求坦白
罪行。如果兩囚徒都坦白,各將被判入獄5年;如果兩人都不坦白,則
很難對他們提起刑事訴訟,因而兩囚徒可以期望被從輕發(fā)落入獄2年;
另一方面,如果一個(gè)囚徒坦白而另一個(gè)囚徒不坦白,坦白的這個(gè)囚徒就
只需入獄1年,而不坦白的囚徒將被判入獄10年。表6-2給出了囚徒困境
的策略式表述。這里,每個(gè)囚徒都有兩種策略:坦白或不坦白。表中的
數(shù)字分別代表囚徒甲和乙的得益。(注意,這里的得益是負(fù)值。)
表6-2 囚徒困境
囚徒乙
坦白不坦白
囚徒甲
坦白-5, -5-1,
不坦白-10,-2, -2
-10
情況下,乙的最優(yōu)策略是坦白;給定乙坦白的情況下,甲的最優(yōu)策略也
是坦白。而且這里雙方都坦白不僅是納什均衡,而且是一個(gè)上策
(dominant strategy)均衡,即不論對方如何選擇,個(gè)人的最優(yōu)選擇是
坦白。因?yàn)槿绻也惶拱祝滋拱椎脑捑捅惠p判1年,不坦白的話就判2
年,坦白比不坦白要好;如果乙坦白,甲坦白的話判5年,不坦白的話
判10年,所以,坦白仍然比不坦白要好。這樣,坦白就是甲的上策,當(dāng)
然也是乙的上策。其結(jié)果是雙方都坦白。這個(gè)組合是納什均衡。
寡頭壟斷廠商經(jīng)常發(fā)現(xiàn)它們自己處于一種囚徒的困境。當(dāng)寡頭廠商
選擇產(chǎn)量時(shí),如果寡頭廠商們聯(lián)合起來形成卡特爾,選擇壟斷利潤最大
化產(chǎn)量,每個(gè)廠商都可以得到更多的利潤。但卡特爾協(xié)定不是一個(gè)納什
均衡,因?yàn)榻o定雙方遵守協(xié)議的情況下,每個(gè)廠商都想增加生產(chǎn),結(jié)果
是每個(gè)廠商都只得到納什均衡產(chǎn)量的利潤,它遠(yuǎn)小于卡特爾產(chǎn)量下的利
潤。
解釋“智豬博弈(boxed pigs)”,并舉商業(yè)案例說明。
市場中的大企業(yè)與小企業(yè)之間的關(guān)系類似智豬博弈。大企業(yè)進(jìn)行研
究與開發(fā),為新產(chǎn)品做廣告,而對小企業(yè)來說這些工作可能得不償失。
所以,小企業(yè)可能把精力花在模仿上,或等待大企業(yè)用廣告打開市場后
再出售廉價(jià)產(chǎn)品。
解釋““夫妻博弈”(battle of the xes)”,并舉商業(yè)案例說
明。
“夫妻博弈”(battle of the xes)的例子講的是一對談戀愛的男
女安排業(yè)余活動,他們有二種選擇,或去看足球比賽,或去看芭蕾舞演
出。男方偏好足球,女方偏好芭蕾,但他們寧愿在一起,不愿分開。表
6-6給出了這個(gè)博弈的得益矩陣。在這個(gè)博弈中,如果雙方同時(shí)決定,
則有兩個(gè)納什均衡,即都去看足球比賽和都去看芭蕾演出。但是到底最
后他們?nèi)タ醋闱虮荣愡€是去看芭蕾演出,并不能從中獲得結(jié)論。如果假
設(shè)這是個(gè)序列博弈,例如,當(dāng)女方先作出選擇看芭蕾演出時(shí),男方只能
選擇芭蕾;當(dāng)女方先選擇了看足球比賽時(shí),男方也只能選擇足球。反
比如在美國汽車產(chǎn)業(yè)發(fā)展史中的某些階段,通用汽車就扮演
過這種領(lǐng)導(dǎo)者的角色(這一例子把模型直接擴(kuò)展到允許不止一
個(gè)追隨企業(yè),如福特、克萊斯勒等等)。根據(jù)斯塔克爾貝里的
假定,模型中的企業(yè)選擇其產(chǎn)量,這一點(diǎn)和古諾模型是一致
的(只不過古諾模型中企業(yè)是同時(shí)行動的,不同于這里的序貫
行動)。
這就是斯塔克爾貝里雙頭壟斷博弈的逆向歸納解。
對斯塔科爾貝里雙頭壟斷博弈的逆向歸納解的評價(jià):
回顧在古諾博弈的納什均衡中,每一企業(yè)的產(chǎn)量為(a一
c)/3,也就是說,斯塔克爾貝里博弈中逆向歸納解的總產(chǎn)量
3(a-c)/4,比古諾博弈中納什均衡的總產(chǎn)量2(a-c)/3要高,
,其中R (L)為企業(yè)雇傭L名工人可以取得的收入(在最優(yōu)
的生產(chǎn)和產(chǎn)品市場決策下),假定R (L)是增函數(shù),并且為凹
函數(shù)。
L保持不變,w降低時(shí)企業(yè)的利潤就會提高,于是較低的等利
表現(xiàn)在圖中的無差異曲線上就是,工會希望選擇一個(gè)工資水
平w,由此得到的結(jié)果(w, L*(w))處于可能達(dá)到的最高的無
差異線上。這一最優(yōu)化間題的解為w*,這樣一個(gè)工資要求將
使得工會通過(w*, L*(w*))的無差異曲線與L*(w)相切于該
從一個(gè)長期來看,兩者的均衡將維持在警察以0.33的概率巡邏犯罪者以
0.4的概率作案上面。現(xiàn)實(shí)中,我們看到,當(dāng)嚴(yán)打的時(shí)候(警察出擊的

本文發(fā)布于:2023-11-10 07:25:35,感謝您對本站的認(rèn)可!
本文鏈接:http://www.newhan.cn/zhishi/a/1699572335211389.html
版權(quán)聲明:本站內(nèi)容均來自互聯(lián)網(wǎng),僅供演示用,請勿用于商業(yè)和其他非法用途。如果侵犯了您的權(quán)益請與我們聯(lián)系,我們將在24小時(shí)內(nèi)刪除。
本文word下載地址:博弈論復(fù)習(xí)題及答案.doc
本文 PDF 下載地址:博弈論復(fù)習(xí)題及答案.pdf
| 留言與評論(共有 0 條評論) |