高鸿业西方经济学微观部分第8版考研真题整理

0 minutes, 22 seconds Read


答:占优策略是指无论其他参与人采取什么策略,该参与人的最优策略都是唯一的策略。如表10-1所示,通过对支付矩阵的分析可以看出,如果A、B两厂商都是理性的,则这个博弈的结果是两厂商都做广告,即不管一个厂商如何决定,另外一个厂商都会选择做广告。占优策略均衡是指占有策略达到均衡时的状态。

表10-1 广告博弈的支付矩阵

2纳什均衡[湖南大学2022研;中南财经政法大学2019、2015研;大连理工大学2018研;东北财经大学2018研;东南大学2018研;东北大学2018研;对外经济贸易大学2017研;中南大学2016研;中央财经大学2015研;北京师范大学2014研;北京理工大学2013研;厦门大学2013研;华南师范大学2011研]

答:纳什均衡又称为非合作均衡,是指这样一种策略集,在这一策略集中,每一个博弈者都确信,在给定竞争对手策略的条件下,他选择了最好的策略。纳什均衡是由所有参与人的最优策略所组成的一个策略组合,也就是说,给定其他人的策略,任何个人都没有积极性去选择其他策略,从而这个均衡没有人有积极性去打破。纳什均衡是博弈论的一个重要术语,以提出者约翰·纳什的名字命名。

3混合策略[华中科技大学2008研;东北大学2007研]

答:混合策略是指在博弈中,博弈方的决策内容不是确定性的具体的策略,而是以某种概率选择不同的策略。混合策略情况下的决策原则有以下两个:

①博弈参与者互相不让对方知道或猜到自己的选择,因而必须在决策时利用随机性来选择策略,避免任何有规律性的选择。

②博弈参与者选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性倾向的某一种策略而在博弈中占上风。

4以牙还牙策略[东北财经大学2012研]

答:以牙还牙策略是一个用于博弈论的重复囚徒困境非常有效的策略。以牙还牙策略的内容是:所有的成员一开始是合作的。对于每一个成员来说,只要其他成员是合作的,则他就把合作继续下去。但只要有一个成员一旦背弃合作协议采取不合作的策略,则其他成员便会采取“以牙还牙”的惩罚和报复策略,即其他成员都采取相同的不合作策略,并将这种不合作的策略在重复博弈中一直进行下去,以示对首先破坏协议者的惩罚和报复。

二、简答题

1用囚徒困境模型说明为什么双寡头市场的价格战难以避免。[西南财经大学2006研]

答:囚徒困境反映了个人理性和集体理性的矛盾,出于个人理性的考虑并不能实现集体理性,个人理性并不是实现集体理性的充分条件。

下面用一个支付矩阵(也称报酬矩阵)来描述和分析一个双寡头市场上的博弈。假定有甲、乙两个寡头厂商,每个寡头厂商都有两个可选择的策略,这两个策略都是合作与不合作。其支付矩阵如表10-2所示,每一格表示对应于甲、乙的一个策略组合的一个报酬组合,每格中的第一个数字表示甲的报酬,第二个数字表示乙的报酬。

表10-2 报酬矩阵

表10-2中,显然(合作、合作)的策略组合要优于(不合作、不合作)的策略组合。这表明甲、乙两个寡头厂商勾结起来,达成合作协议,共同谋求总报酬最大化,就可以避免由于双方都采取不合作策略和相互竞争所造成的两败俱伤的局面。正因为如此,实际上,在寡头市场上,厂商之间经常会达成协议,成立合作性质的卡特尔组织,共谋卡特尔组织的整体利益最大化,且每个成员也均得到一定的好处。

然而,在(合作、合作)策略组合的前提下,如果有一方坚持合作策略,而另一方偷偷地采取不合作策略,则对于偷偷采取不合作策略的参与者来说,(合作、不合作)或(不合作、合作)的策略组合,要优于(合作、合作)的策略组合。这意味着在寡头市场上厂商们在达成合作协议以后,每一个寡头都有强烈的利己动机去偷偷地背离协议,以获得自身的更大的利益。因此,价格战难以避免,两个寡头厂商都期望通过降价来占领市场份额,博弈的最终的结果是卡特尔组织难以维持,两者都会选择不合作。两个寡头厂商都是从个人理性出发,不合作能够得到更大的支付,最后使集体理性不能实现。

2举例说明纳什均衡。[中央财经大学2005研]

答:纳什均衡是完全信息静态博弈解的一般概念,由约翰·纳什(John·Nash)于1951年提出。纳什均衡是指任何一个博弈者在其他参与者的策略给定的条件下,其选择的策略是最优的策略集。所以,给定其他人的策略,任何个人都没有积极性去选择其他战略,从而这个均衡没有人有积极性去打破。

表10-3 一个纳什均衡

如表10-3所示,策略组合(上,左)是一个纳什均衡。证明如下:如果参与人A选择策略“上”,那么,参与人B所能做的最优策略选择就是“左”,这是因为参与人B选择“左”得到的收益是1,而选择“右”得到的收益是0。同样,如果参与人B选择“左”,那么,参与人A所能做的最优策略选择是“上”,因为这样做,参与人A得到的收益就是2,而不是0。

因此,如果参与人A选择“上”,参与人B的最优选择是“左”,而如果参与人B选择“左”,参与人A的最优选择是“上”。于是,就有一个纳什均衡:给定其他人的选择,每个参与人都作出了最优的选择。

3表10-4为两竞争对手的博弈结果矩阵:

表10-4 两竞争对手的博弈结果矩阵

请问:什么是纳什均衡?求出该博弈的所有可能的纳什均衡,利用图形说明求出的纳什均衡的意义。[中央财经大学2010研]

答:纳什均衡又称为非合作博弈均衡,是指如果其他参与人不改变自己的策略,任何一个参与人都不会改变自己策略的均衡状态。

从表10-4该博弈结果矩阵可知存在两个可能的纳什均衡:两竞争对手均奋争,两竞争对手均妥协。

不论A、B均奋争还是均妥协,总的博弈效果是产生了3个效用,比一方奋争另一方妥协效用大。如表10-5所示。

表10-5 博弈状态及其效用值

从表10-5可以看出,两竞争对手均奋争和两竞争对手均妥协都是纳什均衡解,并且带来的总效用一样。

三、计算题

假定某地有两家粥店,它们同时决定是生产甜粥还是生产咸粥。各种可能的情况如下面的支付矩阵所示:

求解此博弈的全部纳什均衡(包括纯策略和混合策略纳什均衡)。[中央财经大学2013研]

解:(1)纯策略纳什均衡

该博弈的纯策略纳什均衡为(咸粥,甜粥)和(甜粥,咸粥)。在纯策略下,两家粥店同时决定生产甜粥还是生产咸粥。先考虑粥店1的策略,假定粥店2选择生产甜粥,则粥店1的最优策略为生产咸粥,此时得到支付为2;若粥店2选择生产咸粥,则粥店1的最优策略为生产甜粥,此时双方都得到支付2。同理,考虑粥店2的策略选择,若粥店1选择生产甜粥,则粥店2的最优策略为生产咸粥;若粥店1选择生产咸粥,则粥店2的最优策略为生产甜粥,因此,该博弈的纯策略纳什均衡为(咸粥,甜粥)和(甜粥,咸粥)。

(2)混合策略纳什均衡

假定粥店1以概率p选择生产甜粥,以概率(1-p)选择生产咸粥,粥店2以概率q选择生产甜粥,以概率(1-q)选择生产咸粥。

则粥店1的期望支付为:E1=-pq+2p(1-q)+2(1-p)q-(1-p)(1-q)=p(3-6q)+3q-1。

粥店1的条件混合策略可以表示为:

粥店2的期望支付为:E2=-pq+2(1-p)q+2p(1-q)-(1-p)(1-q)=q(3-6p)+3p-1。

粥店2的条件混合策略可以表示为:

由两家粥店的条件混合策略可得,混合策略的纳什均衡为:

[(p,1-p),(q,1-q)]=[(0.5,0.5),(0.5,0.5)]

即当粥店1选择混合策略(0.5,0.5)、粥店2选择混合策略(0.5,0.5)时,博弈达到了均衡。

四、论述题

中新网2012年2月7日报道,在中国第三届大学生艺术展演活动中央媒体见面会上,浙江省教育厅厅长刘希平再次表达了改革教育的决心。早在两年前,浙江省教育厅举办的课业减负相关会议上,刘希平就痛批“应试绑架了教育”,倡导开展教育减负的改革。2010年8月,浙江省教育厅就减轻义务教育阶段中小学生过重课业负担下发通知,制定了“六个严格”和“六项制度”,对中小学课时、课程开设、规范考试、学生休息时间等都做了严格的规定。两年后,减负工作成效如何,刘希平感叹,顽疾难治,但决心不改,帮助孩子减负需要教育人持之以恒。“在减负的道路上,那么多年来我们可以说是屡战屡败、屡败屡战,但要改变应试教育的危害,减轻学生负担是必须要做的第一步,我们绝不可以退让。”

试运用博弈理论分析目前的应试教育现象。[暨南大学2013研]

答:目前我国的应试教育现象体现了博弈论中的“囚徒困境”理论。

(1)“囚徒困境”

囚徒困境是指两个被捕获的囚徒之间的一种特殊“博弈”,说明为什么在合作对双方都有利时,保持合作却是困难的。具体情况如下:两囚徒被指控是同案犯。他们被关在不同的牢房里且无法互通信息,各囚徒都被要求坦白罪行。如果两囚徒都坦白,则各将被判入狱5年;如果两人都不坦白,则各将被判入狱2年;如果一方坦白另一方不坦白,则坦白方入狱1年,另一方入狱10年。下面的支付矩阵列明了两个囚徒选择的结果。

如果囚徒A不坦白,他就冒着被囚徒B利用的危险,因为不管囚徒A怎么选择,囚徒B坦白总是最优方案。同样,囚徒A坦白也总是最优方案。总之,可以看出,对囚徒个人而言,选择坦白总比不坦白收益高。但从两人的支付总和来看,双方都不坦白的收益是最高的。因此,囚徒困境揭示了社会和经济生活中的一种普遍情况,即“个人理性”与“集体理性”之间的矛盾。它意味着个人理性并不是实现集体理性的充分条件。

(2)目前应试教育现象中的“囚徒困境”

“囚徒困境”再现了我国教育体制中“减负”口号渐渐陷入应试教育中的情形。学校、学生、家长和社会都意识到“减负”势在必行,“减负”对于莘莘学子来说应该是一种最佳的策略选择,但事实上学生们却做出了弃“减”选增的选择。其原因可以用囚徒困境的原理加以解释。

以学生之间的减负与应试教育的博弈为例,如下表所示,“增负”和“减负”是学生A和学生B各自选择的策略,其中的数字表示的是在该策略下所获得的收益。

在这个博弈矩阵中出现了四种情形:(增负,增负),(增负,减负),(减负,增负),(减负,减负)。对于博弈方A来说,假设博弈方B选择“增负”,博弈方A也会选择“增负”,因为“增负”的得益5大于“减负”的得益2;假设博弈方B选择“减负”,博弈方A出于自身利益的最大化,他依然会选择“增负”。因此,不论博弈方B采取何种策略,博弈方A都会选择“增负”。同样,博弈方B与博弈方A的情形一样。最终这个博弈的纳什均衡是(增负,增负)。

从整个社会的效益来看,(减负,减负)是最好的选择,但每个博弈方出于自身利益的最大化的考量,都会做出与社会收益最大化不同的选择。对于学生之间的博弈来说,(减负,减负)只是一个理想的状态,在现实的教育及其考核制度下是不可能实现的,选择“减负”只会让他们放弃上名校的机会,拉大与他人的距离,而“增负”不过就是多写作业、多上课,但可以获得好的成绩并上好的学校才是他们对自己最负责、最好的选择;对于家长之间的博弈来说,选择“减负”会使自己的孩子远离名校,落后于应试教育的孩子;对于学校之间的博弈来说,“减负”影响的不仅仅是学校的升学率,还有学校排名的下降,从而影响到之后的学生入学量;对于老师来说,“增负”使得学生获得好成绩的同时,也有奖金奖励及地位的提高。不论是学生、老师、家长,还是学校都不愿意承受较小收益的风险,会毫不犹豫的选择占优策略“增负”。

(3)解决应试教育和减负“囚徒困境”的途径

由以上的分析可知,如果要减少增负后带来的支付,必然要彻底改变整个社会对人才的考核制度,仅仅由相关部门下发通知不可能彻底解决应试教育带来的问题。如果社会、学校、家长和学生各方面共同努力,改变各方的博弈策略,可以得到一个新的博弈矩阵,从而摆脱减负中的“囚徒困境”现象。新的博弈矩阵如下:

在这个新的博弈矩阵里,利用划线法可以找到唯一的纳什均衡点,通过四种策略的收益比较发现此时的纳什均衡点达到了全社会的效益最大化,可以说是帕累托均衡状态。

具体而言,社会各方应该从以下方面努力:

①政府应该改革现有教育制度,逐步改变应试教育的教育体制。可通过实现奖惩激励制度和重点培养素质教育学校的方法来改变“增负”“减负”博弈的结构,尤其是要改变目前小升初、中考和高考的应试模式。

②学校应该实行多样化的考核方式,改进教学方法。学校应顺应素质教育的潮流,以考试成绩的衡量学生学习能力的标准是不可取的,考核制度要多样化,考试成绩是重要的标准,但不是唯一的标准,课堂表现、动手能力、组织能力等都应列为标准。照本宣科、布置繁重功课的传统教学方法也应改进,要注重课外知识的传授,学生能力的培养。

③家长转变现有的教育模式,转变教育思想,同时学生要实现自我意识的“减负”。

此外,采取分层推进战略、开展严格的素质教育评估、建立保障机制、提高个体理性行为、创新教育制度等都是走出囚徒困境的途径。只有多种途径的结合才能更有效的解决减负的囚徒困境。

书山有路勤为径,学海无涯苦作舟。——韩愈

Similar Posts

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

|京ICP备2022015867号-3