本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 1 ~- m' L7 Z* g* j# b
- p7 t! A% \/ T8 v
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);2 V) v2 q; C4 S
以下三个定义:* i9 V, a/ |) P! {# W
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 & N+ b, D R% r& r- C
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
' E* F0 ?: L* t: N2 M 所谓的双方优势策略则是指双方利益总和最大的策略。 9 [0 q. |2 |2 l
[编辑本段]严格优势策略举例分析% |* U; ~! b: e7 l3 W
一、经典的囚徒困境 / u% X% ?/ w& _/ V: q+ I* }
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: . ?% k0 R' Q* i$ r5 I
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( ^* g ` v7 w" B' Q/ Q( V' d 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 8 y; ^5 Y, o \: M/ p
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 1 I1 S1 E: X1 R3 ]" ` S4 p
若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 Z7 H: N: w r/ t; U
3 o2 S* Y$ \8 `6 ]0 N6 j用表格概述如下:
. ^ R7 p" l5 R" o# Z# S
c4 Z) D* L: a. \: P 甲沉默(合作) 甲认罪(背叛)
- ]- J) Z; E1 X9 o5 B乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
" u6 S$ y4 c, g) l乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 0 k/ B6 w' n5 d# x- H' ~1 x- ?! C
- U6 B$ ^4 h" v6 u" d% { 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
* o4 G$ p/ y7 R$ _! ]) f: H1 | 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
8 q# \ e, q; V% M& V d" c7 ~ 若对方沉默、背叛会让我获释,所以会选择背叛。
% ?6 h/ u$ O$ J% p! U6 h 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 1 X9 _* H/ u# d% H
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 7 t: K6 |0 ^& s' r( v; A1 y& l
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ' X' D$ ?+ [4 o- x
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 X# e4 f) U6 [/ s* k
[编辑本段]二、智猪博弈理论2 f2 d! ^) u! g& g
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( Y; o4 d+ m$ B* F$ R K, ^. m
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 A- K; B5 M2 }( @- i 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
1 \' X$ f2 k3 B 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
+ L4 G7 m* U7 y “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 s# p* K) L K0 z# w 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
& _/ ?( m( q3 a+ K& P# N. ?" U0 G 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) \& a0 H: O M/ W: o
- u- m4 d/ x% {9 u: p# F4 ]& Q! s三、关于企业价格策略4 g7 ? X V5 V% d
) ]9 b( h. u w1 \
8 T: }* I# A* _% f! e5 c
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 X( P5 |7 r W$ j/ U 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
' c2 J8 p+ n, b: m, O6 p9 { 以下三个定义:5 @% S+ r* Y1 a: p
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
/ K3 T5 `2 K* W4 W7 J 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 & U: F' d2 p- G: H. D4 m9 K
所谓的双方优势策略则是指双方利益总和最大的策略。
! z; @1 [! r* {8 P[编辑本段]严格优势策略举例分析
0 @, S: }5 f3 V8 |; p 一、经典的囚徒困境
- P \' Z% w* n9 ?. ?* @ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
1 p! h- h w" \6 l8 r 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ) {) u; ~0 Y0 ]. W
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( W+ R/ }) _8 A* [; b W9 ^8 y 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 $ w+ c2 b% X4 _) Q' m- F
若二人都互相检举(互相“背叛”),则二人同样判监2年。$ ?- p4 O/ E( y- C1 I
9 Y. X) p/ R1 [. c# w' |. L. r5 l
用表格概述如下:
+ G X/ q& O ^1 U# D: _1 H5 O+ [0 `3 N/ I+ G
甲沉默(合作) 甲认罪(背叛)
7 R# L( O- m& z乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
) F3 q) B& \+ `: J; P* j0 I u- ^乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ; W4 _: a8 a& y3 p- e
' u3 l$ a! Z2 i
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 Q$ `7 v7 n- y 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 k/ ]5 g8 N6 V: ^* \& X 若对方沉默、背叛会让我获释,所以会选择背叛。
, K8 s5 j: h9 l, N" ?3 Q3 D 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 & h5 k; o0 P; V" Y# m' |
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 . v4 C8 S7 t; p d
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& c6 n1 c3 }- p$ N3 k1 V 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。3 C* X4 m) O g- P
[编辑本段]二、智猪博弈理论
; A: I# q. y! _ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 & l1 M% K @9 r1 D+ Y: l: Y
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # V- r1 q& ^1 z# B- N/ J$ H; O- x
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 . ^& Z8 Q2 p, E: |+ g
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 d! P" `3 i7 @% l3 e! O' p2 t
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) ~1 _# ?1 f) Z; e+ {* F
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) |4 V8 n2 i" H6 m$ z! |+ X. G 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
/ X- Y; p$ v5 ]3 T# H* q
" v% ]9 C' x! S4 q: B; H! S三、关于企业价格策略+ |! C* {5 X2 r& Q9 a- w
- b: z! v! k! a2 Z& i; J- Q" V
3 u( z) D! }3 k3 V9 ]" V" R, Z 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
8 N4 y9 V# |$ y+ J3 g 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
" U" }& e/ U8 j) N& ]! {2 G 以下三个定义:$ ]2 l9 D& k( A' v6 j- A4 R* p
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 $ a8 z# K) E) D! I0 F
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 & G9 w# h6 f5 F1 G2 G
所谓的双方优势策略则是指双方利益总和最大的策略。
8 \+ G' v0 g% f/ `+ z2 R: \* l* b) w[编辑本段]严格优势策略举例分析
. z- P8 U. N/ \/ P 一、经典的囚徒困境
8 j+ Q2 _. E0 l% [6 ^8 e7 y 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ! t. ^; _9 Q1 o
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: % k& C5 ^$ @( ?$ b
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 , x' I% R/ r1 N7 D% ]+ p8 b
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 & s5 e( r5 E t* [
若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 R) G) _# n: X1 i. `
: E7 u2 O/ x+ x9 k/ a5 V用表格概述如下:
J/ H& l- @; _0 ~! i" ]" \: b G0 j
甲沉默(合作) 甲认罪(背叛)
; `" Y o! M9 [! |- L' C" C乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 + D s9 b) e% T2 q- [, w% f
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 - ?( X. C* |* l; G$ a
8 ]5 F. y7 M- Z$ p) e. o/ v
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
- l+ P3 U! P. @9 X 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 6 k! a1 p- C- k( {
若对方沉默、背叛会让我获释,所以会选择背叛。
0 C. z( M7 E! E) A, Y9 c' z& Y3 l1 p ] 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ Q+ L) }' c( Y: h6 M- M9 `* A* J
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
! I/ y W* Q5 T1 B) ?) J- {6 W" _# R 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 5 g9 C, Q8 M. o' E$ B. Y, K; f1 F
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。( ?* e8 s3 v* n& o6 P" y) p+ V
[编辑本段]二、智猪博弈理论- l- a2 M, f# V2 s
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( I6 k9 J$ p% ~- d0 V 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
* y# |$ z2 @, G5 m: o3 E2 [: D 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 / [( a5 n# d" k- E
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
) \. E! }% I8 \ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 / H. ^4 b- a# l- F8 ]" B
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 z: [4 A2 e0 P; F7 Y1 \5 g
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
5 c" u/ Q. `7 c6 n) G
: \# |+ i- r6 y) {5 _; s三、关于企业价格策略7 N/ h7 P, `: ]0 |, S0 W5 N2 W1 Q5 g3 {% ~
4 s/ Q* x h' v" z% i
- Y' i4 g- o8 N% b3 f; o, ] 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 s' Q" l. z+ R- ^* l. ~0 C 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
6 n) N! Q+ Y1 R 以下三个定义:! I/ P, g5 C) @ N8 h
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' ^ _& h1 A' v( G |& F( ]: \: O 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
! f }' D% ~+ t$ y, C! n- j7 | 所谓的双方优势策略则是指双方利益总和最大的策略。 * }% N7 W h$ j/ e* B
[编辑本段]严格优势策略举例分析
5 |* B- H: Z! b) P. R. C( J 一、经典的囚徒困境
8 X* E0 T2 r8 ]2 Y5 f# R; ? 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
) B- K1 ~3 H3 e 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' {0 d J# ^* n7 n 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 % f: Z9 R K$ u% u4 I
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
+ M V& o |; e+ E, x8 L; H 若二人都互相检举(互相“背叛”),则二人同样判监2年。
3 y/ U& O; n% n) ?( } 4 h% O' q4 U. }2 U2 D/ e8 g
用表格概述如下:/ r0 [1 K, k1 x% A% E
) b, G" v' T. t 甲沉默(合作) 甲认罪(背叛)
# f N6 W0 H: z8 T; V乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
' N$ U: i6 ^' X/ k0 R# W乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
. n) D# k1 V9 C4 V1 e, h$ n5 @
- i5 p+ ~5 h- W p 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 0 p6 ^$ J4 u' ^4 x
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
$ k8 Q# C7 w' M& n7 q 若对方沉默、背叛会让我获释,所以会选择背叛。 6 R! l3 Q0 K' S7 q) ~
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
9 s9 K( c9 ^2 c; X% W# d( H 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
0 {6 y4 D5 V% W 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
0 ^" I$ o0 M; g$ @" w; t 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ G1 U! [+ R" @/ ^; O/ l9 ]/ h6 l* l+ b
[编辑本段]二、智猪博弈理论
( h# T, B, y" l t5 z+ d2 O# s 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
3 H" W( e! I( C5 L/ Y8 w/ r 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
8 L. Q2 q+ J! G' u: ~ 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 . f2 [9 T6 M- V! T- _
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 a `7 A' {" q. A- H
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 6 J- V4 `$ G1 ~/ {& W
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 x7 B% G' b. ^$ ?8 S! A- W 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
/ O2 K3 O( I! a0 i2 a
6 p* b4 e; Q' z三、关于企业价格策略1 H, f j. j1 j) n9 S% _
/ `6 R$ ?& V$ E& f
, Y7 o, X- w; R
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? % N6 d" W1 W1 U" D2 J
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |