第十一讲 广延型博弈与反向归纳策略

发布于:2021-10-16 18:57:50

第十一讲 广延型博弈与反向归纳策 略
广延型博弈适合于分析动态博弈过程,其强 调的重点在行动的时序性,以及参与人决 定策略时所拥有的信息集。 ? 第一节 广延型博弈的定义与形式 ? 一、广延型博弈的定义 ? 信息完美(perfect information),是指每一 个参与人在其作决策时,对于以前所发生 的事件具有完全的信息。 ?

广延型博弈构成要素
(1)决策点与决策分枝的结构,在初始决策点与最终 结局点之间不存在任何闭环(closedloops); (2)清楚地指明什么决策点属于哪一个参与人; (3)在自然决策点上选择的概率是公共知识; (4)参与人作决策时所依据的信息集;信息集把参与 人在某一时刻的所有决策点分成若干类; (5)在博弈的终极点上每一个参与人的收益

二、广延型博弈的形式
? 广延型博弈是以“决策树”或“博弈树” 的形式来表达的。

1

L
2

R
2

M

N

M
(1,0)

N
(3,1)

(2,0) (2,-1)

三、广延型博弈的规则
? 第一,初始点没有一条箭头指向它;对其 他所有箭头,都只有一条箭头指向它。 ? 第二,如果我们从某一点向初始点返回, 我们就不可能再通过迂回的途径回这一点, 我们只能按反向逐次返回原点。 ?

第二节完美信息广延(动态)博弈
? 一、特征。 特征。 ? (一)决策有先后顺序 ? (二)关于博弈进程的信息是不对称的 ? 后决策者拥有更多信息。

(三)具有完美信息: 即参与人决策时完全了解之前的博 弈过程的信息。 (四)动态博弈至少有两个阶段; 阶段: 阶段: ? 参与者在某一时点进行的一次决策。 ? ? ? ?

二、可信性: 可信性
? 先决策者对后决策者行为的信任性。 ? 即先决策者是否相信后决策者是否采取 ? 有利的(许诺)或不利的(威胁)行为。

例1:父女博弈。 :
? 女儿交了一个父亲不喜欢的男友, ? 父亲威胁说:“你如果不断绝与他的关系, 我与你断绝关系。” ? 女儿是否相信父亲的威胁?这一博弈可如 下表示:

女 儿

父 亲

? 作为女儿,知道父亲断绝与女儿的关系 ? 损失是非常大的, ? 因此,对父亲来讲,即使女儿不听话, “断 ? 绝”是下策,应被剔除掉:

女 儿

父 亲

聪明的女儿在看到父亲的威胁不可信时, 一定不会选择“不交往”
女 儿

父 亲

父亲的威胁是不可信的。
? ? ? ? 因此,所谓不可信的威胁, 就是指一旦采取该策略, 给他本人带来的收益 并非最大的策略

例2:开金矿(二阶段):
? ? ? ? ? ? 参与人2欲开采一价值4万元的金矿, 但缺乏1万资金,参与人1恰拥有 一万元资金。参与人2对参与人1说: “如果你把钱借给我, 我与你*分开金矿所得。” 参与人1是否应相信2把钱借给他?

1 2

在参与人借的资金开发金矿后, 在参与人借的资金开发金矿后, *分所得是其下策,故应被剔除: *分所得是其下策,故应被剔除: 1 2

这时,“借”成为参与人1的下策, 故应被剔除: 1

参与人2的许诺是不可信的。
? 所谓不可信的许诺, ? 就是指一旦采取该策略, ? 给他本人带来的收益 ? 并非最大的策略

例3:开金矿(三阶段) :开金矿(三阶段)
? ? ? ? 在有完善的法律制度的条件下, 在有完善的法律制度的条件下, 参与人1可以在参与人而不信 参与人 可以在参与人而不信 守承诺的情况下选择与其打官司, 守承诺的情况下选择与其打官司, 这样就变成了一个三阶段博弈。 这样就变成了一个三阶段博弈。

? 这时参与人 是否应相信2的承诺? 这时参与人1是否应相信 的承诺 是否应相信 的承诺?

1 2 1

在参与人2不信守承诺的情况下, 在参与人 不信守承诺的情况下, 不信守承诺的情况下 不打官司是参与人1的下策故应被剔除 不打官司是参与人 的下策故应被剔除
1 2 1

由于参与人1必定会选择打官司, 由于参与人 必定会选择打官司, 必定会选择打官司 故不分是参与人2的下策因此被剔除 故不分是参与人 的下策因此被剔除
1 2

在这种情况下,参与人 知道参与人 知道参与人2 在这种情况下,参与人1知道参与人 必定会其起*分收益, 必定会其起*分收益,不借则变成了 他的下策,剔除之。 他的下策,剔除之。
1 2

? 在法律制度建立后, ? 参与人2 的许诺变为可信 ? 在法律健全时, ? 既可保障社会公*, ? 又可提高社会经济活动效率。

? 所谓可信的许诺(威胁), ? 就是指一旦采取该策略, ? 给他本人带来的收益一定 ? 最大的策略

三、子博弈和逆推归纳法
? (一)子博弈: ? 从一个博弈的某个阶段开始的 ? 能够自成一个博弈的后续阶段。 ? 它必须有一个初始信息集, ? 具备进行博弈的需要的各种信息。

(二)逆推归纳法:
? 从动态博弈的最后一个阶段 ? 或最后一个子博弈开始, ? 逐步倒推以求解动态博弈的方法。

四、子博弈精炼纳什均衡
? ? ? ? ? 如果动态博弈中各参与人 的策略在动态博弈本身和 所有子博弈中都构成一个 纳什均衡,则称该策略组合为 一个子博弈精炼纳什均衡。

讨价还价博弈( 例4.讨价还价博弈(三阶段) 讨价还价博弈 三阶段)
? ? ? ? ? ? ? ? 设两人就如何分割1万元进行谈判, 规则如下:首先由1提出 一个分割比例S1,2可以接 受也可以拒绝,如果2拒绝, 则提一个分割比例S2, 这时1可以接受, 也可以拒绝,如果拒绝, 则出价S则2必须接受

假设每经过一轮要有一定的折扣, 假设每经过一轮要有一定的折扣, 折扣因子为

δ

δ

的大小与谈判者的耐心, 的大小与谈判者的耐心, 通货膨胀以及资金的时间 价值等有关。 价值等有关。



解:展开表示为
1

2 1

应用逆推归纳法。 第三阶段: 1出S,2必须接受,因此S=1
1

2 1

第二阶段:2知道在第三阶段 1必出S=1,因此,为了避免 这一情况的出现,自己出的S2 (即1的所得)应满足:

δ S2 ≥ δ 即S 2 ≥ δ
S2 = δ

2

为了使自己的利益最大必有

这时博弈树变为
1

2 1

? 第一阶段,如果1的出价S1满足 ? 1-S1≥δ(1-δ) ? 即S1≤1-δ+δ2 ? 则2不会拒绝

? 因此,1的最优出价 ? S1=1-δ+δ2 ? 这时 ? S1=1-δ+δ 2>δ2 ? 避免进入下一段谈判, ? 双方获得的收益均达到最大。 ?¥

最终的博弈路径 (子博弈精炼纳什均衡)为
1

2

例5.求下列四阶段动态博弈 的子博弈精炼纳什均衡。

1 2

1 1

第三节 有同时选择的动态博弈
? 一、特征: 特征: ? 在博弈的某些阶段, ? 有多个参与者同时进行决策

例1
V (2,2) 1 L D 2 Vˊ 2 R 1 Dˊ 2 Rˊ Lˊ Rˊ

(3,1)

Lˊ (-2,2) (2,-2) (2,-2)(-2,2)

? 当博弈进行到第三阶段时,1,2必须同时 作了决策, ? (或者说,每个参与人在决策时,并不知 道对方作出了什么选择)。 ? 这样在第三阶段构成了一个策略(静态) 博弈(二人零和博弈)。

这一策略(静态)博弈的收益矩阵为: 参与人2 参 Lˊ 与 Dˊ -2,2 人 1 Vˊ 2,-2 Rˊ 2,-2 -2,2

? 这个策略(静态)博弈有唯一的 ? 一个混合策略纳什均衡: ? ( (1/2,1/2), (1/2,1/2)) , ? 其带给双方的期望收益(0,0) ? 这样这个博弈可以简化为

1 V (2,2) L

D 2 R (0,0)

(3,1)

继续运用逆推归纳法, 易求得子博弈精炼纳什均衡为 1 L (3,1) D 2

二、求解方法
? (一)按逆推归纳法的思路进行求解。 ? (二)对同时选择构成策略(静态)博弈 的阶段,分别应用策略(静态)博弈求解 法求解 ? (三)将求解结果分别代入原博弈简化, ? 再按逆推归纳法求解。

例2,银行挤兑 ,
? ? ? ? ? ? 两客户在银行各存100元,银行 将这200元投资于一个长期项目, 如果在项目到期前抽回资金, 则只能收回140元(记为日期1), 如果到期后(日期2)再收回投资, 则可回收本利280元。

客户抽回存款的日期也是这两种, 这一博弈可扩展表示如下:

抽 2 抽 (70,70) 不抽

1

不抽 2 抽 不抽 1

(100,40) (40,100) 抽ˊ 2

不抽 2

抽 (140,140)

不抽 (140,100)



不抽 (100,100)

(100,140)

解:应用逆向归纳法的思想求解。 在日期2(即第二阶段), 两客户决策构成了一个策略(静态)博弈 其正规型表示如下 2 1 抽 不抽 抽 140,140 100,140
日期2

不抽 140,100 100,100

? 显然,这一策略(静态)博弈有唯一的 ? 纳什均衡为(抽,抽),其收益分别为140, 140。 ? 将这一结果代入原博弈, ? 可简化为:

抽 2 抽

1

不抽 2 抽 不抽 (140,140)

(70,70) (100,40)(40,100)

它又构成了一个策略(静态)博弈 其正规型表示如下
2 1 抽 不抽 概率 P 70,70 100,140 抽 不抽 40,100 140,140 1-P r 1-r 概率 日期1

? ? ? ? ?

这一博弈有两个纯策略纳什均衡 (抽,抽)和(不抽,不抽), 还有一个混合策略纳什衡, 即各以4/7的概率在第1日 期抽回资金。

结果分析:
? 1.当信用环境非常好的情况下, ? 客户的选择是在第1日期 ? “不抽”,在第二日期“抽回”, ? 双方获利最大(140,140)

2.当信用环境非常不好的情况下, 客户的选择是在第1日期“抽”, 在双方获利最小(70,70)

3.当信用环境一般的情况下, 客户数量很大时,将有4/7的 客户在第1日期抽回资金。 或者说,客户将抽回4/7的资金

例3,关税与不完全国际竞争 设有两个国家1,2,分别 有两上企业(分别记为企业1, 企业2),企业1,2生产既内 销又出口的相互竞争商品, 确定国家1,2的关税策略和 企业1,2的产量策略。

例3,关税与不完全国际竞争
设有两个国家1,2,分别有两上企业(分别 记为企业1,企业2), 企业1,2生产既内销又出口的相互竞争商品, 确定国家1,2的关税策略和企业1,2的产 量策略。

设Qi为国家i的市场商品总量,反需 求函数Pi=a-Qi,企业i生产hi个单位 供内销,ei单位供出口,因此 Qi=hi+ej(i≠j)单位成本为常数C, 国家i的关税率为ti

? 设设首先由两国政府同时制定关税率ti, ? 企业1、2根据t1,t2同时决定各自内销和 ? 出口的产量(h1,e1)和(h2,e2)。

解:企业以利润最大化为目标, 利润函数为

π i = π i (t1 , t 2 , h1 , h2 , e1 , e2 )

= pi hi + p j ei ? c(hi + ei ) ? t j ei

? c(hi + ei ) ? t j ei

= (a ? hi ? e j )hi + (a ? ei ? h j )ei

(i ≠ j )

? 国家以社会福利最大化 ? 为目标,包括消费者剩 ? 余,本国企业的利润和 ? 国家关税三部分,社会 ? 福利函数为:

wi = wi (t1 , t 2 , h1 , h2 , e1 , e2 ) 1 2 = (hi + e j ) + π i + ti e j 2 (i ≠ j )

应用逆时归纳法来分析此博弈 先从第二阶段开始, 可设t1,t2已定,求maxлi的解

h ,e

0 i

0 i

? ?π 1 ? ?h 1 ? ? ?π 1 ? ?e ? 1 由 ? ?π 2 ? ? ?h2 ? ? ?π 2 ? ?e2 ?

=0 =0 =0 =0

得 h e1 h e
0

0 1

= = =

0 2

0 2

a ? c + t1 = 3 a ? c ? 2t2 3 a ? c + t2 3 a ? c ? 2 t1 3

再回到第一阶段两国之间的博弈。 将上述结果分别代入wi得

wi +

18 2 (a ? c ? 2t j ) 9

[2(a ? c ) ? t1 ] =
+

2

9 ti (a ? c ? 2t j ) 3

(a ? c + ti ) +

2

?wi 令 =0 ?ti
得 t1 = t 2
0 0

a?c = 3

即两国的最佳关税选择为

a?c a?c ( , ) 3 3
4(a ? c ) hi = 9 a?c ° ei = 9
°

将这一结果代入得


相关推荐

最新更新

猜你喜欢