本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
9 H, A6 q$ L) n
p7 K8 Y( f9 w V7 {; [严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);2 P2 d2 V8 r1 X4 x* L4 X$ z/ f
以下三个定义:, P! X; h2 V( T' t5 |* R! J
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 " u, u8 k/ Y6 I/ I9 h
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% r- r: {( V/ I% v 所谓的双方优势策略则是指双方利益总和最大的策略。 1 T' e2 z# ~/ i$ }
[编辑本段]严格优势策略举例分析" E, Y8 N2 R( F) e) d
一、经典的囚徒困境 6 B6 p4 |8 i2 |' E2 _& q! X
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 X5 e9 l3 j8 D, l$ _* G8 Y1 r 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ) Z5 ?8 D" x3 k2 ~
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ; j: g+ i* \" p
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 l9 Y" y8 r; j* u; ^/ _6 U 若二人都互相检举(互相“背叛”),则二人同样判监2年。" U6 p8 d, q: S x* o) [5 s
. w S4 [( Q6 w
用表格概述如下:0 p# U* E: k3 r; |9 {! r6 M0 ?8 U
* |0 R, o, Z0 h* N, k
甲沉默(合作) 甲认罪(背叛)
% ]3 K: G2 l# }: a/ I% |' c! s乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
, D# j0 H5 _8 w$ B乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 & E- u q( v" |& ~! c7 h6 X
) W3 \, {! `% M- q9 p 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
& ~) k7 h: N6 ]; J8 z 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # Z0 y1 `/ H1 R! k, g$ ^
若对方沉默、背叛会让我获释,所以会选择背叛。 + L6 u. |8 H- `/ ]/ G! \. ~
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; ]! X* {7 ^- P9 N u! j
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' ^* G5 e+ e/ x- l 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 9 ^5 s0 C+ L% k
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。3 ~7 v# K8 a: V4 v$ ~ j
[编辑本段]二、智猪博弈理论
) d3 m9 F1 B3 z! M 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 , L# j/ r# l* @2 d
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
+ g8 M$ n% j9 l: R 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
- [6 m" M" [5 {' s; l! ]+ l 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 T6 [( Q2 d8 W
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! C/ J. F+ l6 T3 j 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
" U. D6 E! F" S) v3 |2 x: H! c# j: a 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: i% `# M" a8 n& D; t$ K $ n" h! a! U% f) ]2 S6 G
三、关于企业价格策略
4 j7 [$ ^- T( W5 f4 @; x5 l+ X; h' O" K/ Q
# ?7 [+ _: ~- s+ T
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
) {" Y! m% K5 w9 Z8 v 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 @2 Q' W; t# {3 v 以下三个定义:
- a3 R5 k: c( f2 D+ i 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ C3 n0 n: q# T: R$ P7 T 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
( y9 E0 |. a! a* n. L& c. _; { 所谓的双方优势策略则是指双方利益总和最大的策略。 4 g1 d$ l" Q$ U* z1 E. `
[编辑本段]严格优势策略举例分析
. ], p+ h( h5 b7 ^2 w 一、经典的囚徒困境 3 a- D9 G8 D6 v. e# o& H
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " V( b* T3 r' Q/ b7 _
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: % T, [8 I I4 f9 \$ m
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ w, n9 P+ ]- c P6 w 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) [* L9 s5 o& |2 o2 B
若二人都互相检举(互相“背叛”),则二人同样判监2年。# I4 \1 _; \. w$ H' ?
+ \# g' r" N$ _8 s' ?& |( O用表格概述如下:% a8 [3 L) B' l n) E5 E/ |1 h
, W+ g# B z& K! h1 l# a1 p
甲沉默(合作) 甲认罪(背叛) 6 B2 l7 [- ]- d& r# O: v
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
" F* u% \1 q$ B/ j' @乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 # }7 d( ~0 \8 \; Z
' h% }! b8 V# |( D$ Y 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ' |3 ^, R/ [ K% f( e
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- v# D+ r3 G+ O1 f 若对方沉默、背叛会让我获释,所以会选择背叛。 5 G* ?: K& i( S1 e( s
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 : w0 }; p: P3 J/ D: P! X: G# N
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
, m/ {5 Y5 P4 h 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
1 T. n* q. W- w+ ~0 F 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
! Z" G! b G/ u( c[编辑本段]二、智猪博弈理论8 d& y) @' \2 ~$ |: |
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 c |) R" w- Q# `2 x/ n3 } 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
8 s1 x9 R$ o2 d: Y. U3 T 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* h& _& o* K& p, P1 f0 G 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " s8 L8 p1 X+ l* _. x! t' L
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) M7 L b# m; D5 J3 G, T, T
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 8 y* m& } t# }
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。, D. e8 }& c1 I% p$ F8 @+ m' x
" X) C% i- a3 t: [
三、关于企业价格策略1 c. K8 L8 ~ f0 v: K' I( X
1 D0 _8 Q* n& Q" g' k V
- P$ b* V) B$ Q 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
5 w2 B2 o2 T# W; c8 i; k( D 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 Z( X8 t/ I; z* g
以下三个定义:6 |6 D5 ?' X) b9 i! ~
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
2 [+ T O; ]) U 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 # \3 Q; t& f( ~3 n/ ? `
所谓的双方优势策略则是指双方利益总和最大的策略。
- J% u7 O' R7 G$ J3 O5 A[编辑本段]严格优势策略举例分析
/ a5 j4 q1 ~% k 一、经典的囚徒困境
8 D$ a$ p% Q- A1 F( \% T; I5 I. E9 q3 Q 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 G' e2 a+ d3 n7 u4 r4 b 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ) d$ U+ @3 I m6 Q& A
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
9 } B0 c- b0 S7 ?+ j 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
% Z9 e) @, C% V( C, j e8 O 若二人都互相检举(互相“背叛”),则二人同样判监2年。% p4 Y0 F4 P- _
/ A7 k Y/ p% H
用表格概述如下:! ]- N% }7 W( R [4 {
( s m. M! u% e5 d5 g: } 甲沉默(合作) 甲认罪(背叛)
& K$ u/ g- [! y- X' b乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 " @ A' G+ R% B* T: x/ }& d
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
! o) v, J& ^5 T0 {6 ] z4 k8 `& @ y- Z9 c3 `
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ! d% u9 A+ G3 m
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 3 O: |% i. O0 R Z* Q
若对方沉默、背叛会让我获释,所以会选择背叛。
2 r8 A4 z0 N3 I/ }( {, \ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 4 X3 |! ]/ ~3 q4 \% j% ~& l) q; k
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 K* `# J6 E3 I% q2 `( g
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 8 t% H! ~- j8 T/ f4 C
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。0 \3 V1 z _* h+ [' s X9 y
[编辑本段]二、智猪博弈理论
: ]9 G* o( H2 j 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* J+ S4 G9 I5 x2 ` 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
( }* q0 Q$ y6 c6 o5 w! N6 d 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
p M0 k: R# `! s1 J ] 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 A \7 f x; J9 {1 ?6 y
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 1 j1 W5 E1 m) A/ f
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
7 N% W. R ?) S 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
+ w$ g+ S/ S5 j9 K2 f! K5 V5 X
: s' g$ h; t5 `+ a三、关于企业价格策略) b. ~. D5 [/ e) [
9 d" w h! Y# \
0 r' K5 D# ~& K/ J; k 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
6 c5 ?0 z* L5 d |# f- J 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 g3 X2 k* H" G& E 以下三个定义:
( P0 Q4 N7 ^( L l# a5 j0 Y; N 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' s( M" e2 b0 i 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 , W! _9 \, ?5 L: f# m
所谓的双方优势策略则是指双方利益总和最大的策略。
% l$ {6 }% Q, d2 K; p# K$ W, ~9 b+ g[编辑本段]严格优势策略举例分析: D3 ^3 e! i, t" k
一、经典的囚徒困境 # Q; V0 b' o x' T( @) A1 y/ d
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 9 i* ~( X3 ]" |' N0 u( m& c
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( [( T" G. F @) L+ Q4 ] 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& c- q& N! `1 e/ y4 b9 E' r 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 I7 Y7 R# ^# M. W Y% \
若二人都互相检举(互相“背叛”),则二人同样判监2年。2 L0 y: d6 [( j
K/ H( e m8 t- L7 U$ g4 v4 d用表格概述如下:7 a( v; I* z: }2 @1 O6 j
9 n3 |2 ?: V# Y
甲沉默(合作) 甲认罪(背叛) & k B1 _& Y2 b$ g2 ]! }
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
3 `8 O5 T" M% {1 G+ a8 ~. N乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 9 r# w. r+ \6 F2 U0 y" h2 Z
% D' Q+ F/ v6 j( i' y" W9 v 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 g0 M0 U& p: X, ]! D% c) L5 P 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 6 ^; I; t0 l5 G1 S9 V- z
若对方沉默、背叛会让我获释,所以会选择背叛。
8 ]; \* T( H" m 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ ]$ X1 Y" m$ z1 s6 o 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 1 t0 s3 Y: |" m9 q/ F# u
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 % @% @- \0 l" T' n
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
% R5 ], v; ~- D+ R+ x- c& D' y[编辑本段]二、智猪博弈理论, `9 c6 M' k! q' m) b
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 1 ]: s J# Y' ?( N: ?3 z/ U+ H
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
+ P7 P' ?) {1 B3 h' Z$ J 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" C9 {2 Q7 _, B8 @- @3 T- V0 Y 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 " @/ t, g6 x7 I6 N+ U0 z" b. r
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
4 o9 \9 h. C5 A* d 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 0 W9 T: t3 m7 y# q) c
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
" n$ l3 C0 _* r+ B . s7 D1 }8 m/ z2 Q8 S, w1 Q
三、关于企业价格策略
, M. f# u$ l/ ]9 D* ?, i( N+ p
3 a3 p( x6 ]/ k9 w. F6 T3 R6 ? ' I( Q# V# q- `' M7 Z: S+ _
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
9 r- h0 q& i6 W+ G8 ] 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |