小蜜蜂問答

小蜜蜂問答

博弈論基礎 Ⅱ：完全資訊動態博弈

Day 發表于娛樂2021-02-28

四種主要的博弈型別：

完全資訊靜態博弈

完全資訊動態博弈

不完全資訊靜態博弈

不完全資訊動態博弈

本文參考書籍：

《博弈論基礎》羅伯特·吉本斯

《博弈論》讓·梯諾爾

本文介紹

完全資訊動態博弈

。完全資訊靜態博弈具有的兩個特點分別是完全資訊和動態。

動態

是指，在博弈中，參與人的行動有先後順序，且後行動者能夠觀察到先行動者所選擇的行動。

完全資訊

是指，每一個參與者的收益函式在所有參與者之間為公共知識，即每個人既知道自己的收益函式，也知道別人的收益函式，別人也知道你知道他的收益函式……以此類推。我們還需要在此瞭解一下

完美

資訊這一概念，

完美

是指，在博弈進行的每一步當中，要選擇行動的參與人都知道這一步之前博弈進行的整個過程；

不完美

是指，在博弈的某些階段，要選擇行動的參與人並不知道在這一步之前博弈進行的整個過程。

在開始正文之前，大家不妨考慮一個很有趣的問題。假如你剛從銀行取出一筆錢，突然遇到一個劫匪拿著一顆手雷來威脅你：如果你乖乖交出現金，他就不傷害你；如果你不交出現金，他就引爆手雷（兩個人同歸於盡）。請問你會如何做呢？

2。1 完全且完美資訊動態博弈

2.1.A 逆向歸納法

前面的手雷博弈就屬於完全且完美資訊動態博弈：

參與者1從可行集

中選擇一個行動

參與者2觀察到

，之後從可行集

中選擇一個行動

兩個參與人的收益分別為

。

我們可以用逆向歸納法求解此類博弈問題，方法如下：

當在博弈的第二階段，參與人2已經觀察到了參與人1的行動，所以他面臨的決策問題可以表示為：

$\max_{a_2\in A_2} u_2(a_1,a_2)$

假定對於參與人1任意的行動

，參與人2的最優選擇是唯一的，那麼上式的最優解

可以看做是

的函式，用

表示。

由於上述問題對於參與人1來說也是可解的，即參與人1可以預測到參與人2針對行動

的行動選擇

，所以參與人1在第一階段面臨的決策問題可表示為：

$\max_{a_1\in A_1} u_1(a_1,R_2(a_1))$

假定對於參與人1的這一最最佳化問題有唯一解，表示為

，則改問題的逆向歸納解為

2.1.B 斯塔克爾貝里雙頭壟斷模型

斯塔克爾貝里（1934）提出了一個雙頭壟斷的動態模型，其中一個支配企業（領導者）首先行動，然後從屬企業（追隨者）行動，這在現實經濟環境中也是很常見的。

博弈可以具體如下表示：

企業1選擇產量

$q_1\geq0$

企業2觀測到

，然後選擇

$q_2\geq0$

企業

的收益函式等於其利潤函式：

$\pi_i(q_i,q_j)=q_i[p(q_i,q_j)-c]=q_i[a-(q_i+q_j)-c]$

其中

是商品價格函式；

是產品邊際成本，為一常數，無固定成本。

我們應用逆向歸納法進行求解，首先計算企業2對企業1任意產量的最優反應

：

$\max_{q_2\geq 0}\pi_2(q_1,q_2)=\max_{q_2\geq 0}q_2[a-(q_1+q_2)-c]$

由上式可得

：

$q_2=R_2(q_1)=\frac{a-q_1-c}{2}$

由於企業1也可以解得企業2針對

的最優反應，即他可以預測到企業2會選擇

，那麼在博弈的第一階段，企業1面臨的決策問題可表示為：

$\max_{q_1\geq 0}\pi_1(q_1,q_2)\\=\max_{q_1\geq 0}\pi_1(q_1,R_2(q_1))\\=\max_{q_1\geq 0}q_1[a-(q_1+R_2(q_1))-c] \\=\max_{q_1\geq 0}q_1\frac{a-q_1-c}{2}$

由上式可得

：

$q_1^*=\frac{a-c}{2}$

及

$q_2^*=R_2(q_1^*)=\frac{a-q_1^*-c}{2}=\frac{a-c}{4}$

這就是斯塔克爾貝里雙頭壟斷模型的逆向歸納解。

2.1.C 序貫談判

我們首先分析一個三階段的談判模型。參與人1和參與人2就如何分配1元錢進行談判。他們輪流提出方案：

參與人1提出一個分配建議，參與人2選擇接受或者拒絕；

如果參與人2拒絕，就由參與人2提出一個分配建議，參與人1選擇接受或者拒絕；

如果參與人1拒絕，就由參與人1再提出一個分配建議，參與人2選擇接受或者拒絕；

以此類推……

每個參與人需要對下一階段的收益進行貼現，貼現因子為

$\delta$

。

下面是對三階段談判模型更詳細的描述：

（1a）在博弈開始時，參與人1建議他分走1美元的

，留給參與人2的份額為

；

（1b）參與人2可以選擇接受這一條件，按照

獲得收益，也可以拒絕這一條件，博弈進行到下一階段；

（2a）在博弈的第二階段，參與人2建議參與人1分走1美元的

，留給自己的份額為

；

（2b）參與人1可以選擇接受這一條件，按照

獲得收益，也可以拒絕這一條件，博弈進行到下一階段；

（3）在博弈的第三階段，參與人1得到1美元的

，留給參與人2的份額為

。

上述模型是將無限博弈模型簡化為三階段模型，第三階段二者的收益時外生給定的，可以看做是未來無限階段期望收益在第三階段的現值。

我們利用逆向歸納法進行求解。

在第二階段，若參與人1接受參與人2的建議，則他在第二階段會獲得收益

，若參與人1拒絕參與人2的建議，則他在第三階段會獲得收益

，這個收益在第二階段的現值為

$\delta s$

，則當且

$s_2\geq \delta s$

時，參與人1才會接受參與人2的建議。所以參與人2在第二階段提出的建議會是

$（s_2^*,1-s_2^*）=(\delta s,1-\delta s)$

；

在第一階段，參與人1知道，如果參與人2拒絕自己的建議，則參與人2會在第二階段獲得

$1-s_2^*=1-\delta s$

的收入，這個收入在第一階段的現值為

$\delta(1-s_2^*)=\delta(1-\delta s)$

。所以，當且僅當

$1-s_1\geq\delta(1-\delta s)$

時，參與人2會接受參與人1的建議，此時

$(s_1^*,1-s_1^*)=(1-\delta(1-\delta s),\delta(1-\delta s))$

。

（s_1^*，1-s_1^*）就是該三階段博弈的逆向歸納解。

2。2 完全非完美資訊兩階段博弈

2.2.A 理論：子博弈精煉

現在我們對前一節所討論的博弈型別加以豐富，與上節分析的不同之處在於，本節我們每一階段中存在著同時行動。

我們將分析以下型別的簡單博弈，並稱之為完全非完美資訊兩階段博弈：

參與者1和2同時從各自的可行集

和

中選擇行動

和

；

參與者3和4觀察到第一階段的結果

，然後從各自的可行集

和

中選擇行動

和

；

收益為

，

。

許多經濟學問題都符合以上特點，比如對銀行的擠提、關稅和國際貿易的不完全競爭以及多人競爭升職。我們解決此類問題使用的方法，仍然沿用逆向歸納的思路，從博弈的最後階段逆向推導至第一階段就求解了博弈。

2.2.B 對銀行的擠提

兩個投資者每人存入銀行一筆存款D，銀行已將這些存款投入一個長期專案。如果在該專案到期前銀行被迫對投資者變現，共可收回

，這裡

。不過，如果銀行允許投資專案到期，則專案共可取得

，這裡

。

有兩個日期，投資者可以從銀行提款：日期1在銀行投資專案到期之前，日期2在到期之後。假設不存在貼現。如果兩個投資者都在日期1提款，則每人可得到

，博弈結束。如果只有一個投資者在日期1提款，他可得到

，另一人得到

，博弈結束。如果兩人都不在日期1提款，則專案結束後投資者在日期2進行提款決策。如果兩個投資者都在日期2提款，則每人得到R，博弈結束。最後，如果在日期2兩個投資者都不提款，則銀行向每個投資者返還R，博弈結束。

兩個投資者在日期1和日期2的收益情況，可以用下面的兩個標準式博弈表示。

日期1：

提款

不提

提款

r， r

D， 2r-D

不提

2r-D， D

下一階段

日期2：

提款

不提

提款

R， R

2R-D， D

不提

D， 2R-D

R， R

我們從後往前分析。對於日期2的標準式博弈。由於

，“提款”嚴格優於“不提款”，那麼這一博弈有唯一的納什均衡：兩個投資者都將提款，最終收益為

。由於不存在貼現，日期1的標準式博弈變為：

提款

不提

提款

r， r

D， 2r-D

不提

2r-D， D

R， R

由於

，這一由兩階段博弈變形得到的單階段博弈存在兩個純戰略納什均衡：

（1）兩個投資者都提款，最終收益情況為

；

（2）兩個投資者都不提款，最終收益為

前一種結果可以截石位對銀行的一次擠提。如果投資者1相信投資者2將在日期1提款，則投資者1的最優反應也是去提款，即使他們等到日期2再去提款的話兩人的福利都會提高。這裡的銀行擠提博弈在一個很重要的方面不同於上一章討論的囚徒困境：雖然兩個博弈都存在一個對整個社會是低效率的納什均衡但是囚徒困境中這一均衡是唯一的，而在擠提模型中還同時存在另一個有效率的均衡。

上一篇：<<港中深有什麼真正的黑點？

下一篇：明天是祖國71歲生日嗎？>>

標籤：博弈提款參與日期收益