谁能说说博弈论?
博弈论的思想古已有之,而《孙子兵法》不仅是一部军事著作,也是最早的博弈论专著。博弈论起初主要研究棋类、桥牌、赌博的输赢。人们对游戏局势的把握仅仅停留在经验上,并没有发展成为一种理论。直到20世纪初,它才正式发展成为一门学科。1928冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦撰写的划时代巨著《博弈论与经济行为》将二人博弈扩展到N人博弈结构,并将博弈论体系应用到经济领域,从而奠定了这门学科的基础和理论体系。说到博弈论,就不能忽略博弈论天才纳什,纳什的开创性论文《N人博弈的均衡点》(1950)、《非合作博弈》(1951)等。,并给出纳什均衡的概念和均衡的存在定理。此外,塞尔顿和哈萨尼的研究也促进了博弈论的发展。今天,博弈论已经发展成为一门相对完善的学科。
游戏元素
(1)玩家:在一场比赛或游戏中,每一个拥有决策权的参与者都成为玩家。只有两个玩家的游戏现象称为“双人游戏”,两个以上玩家的游戏称为“多人游戏”。
(2)策略:在一场游戏中,每个玩家都有一个切实可行的完整的行动计划,即该计划不是某一阶段的行动计划,而是指导整个行动的计划,一个玩家自始至终可行的行动计划,在这场游戏中称为该玩家的策略。如果一个博弈中的每个人总是有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。
(3)得失:一局结束时的结果叫得失。一局结束时每个局中人的得失不仅与局中人自己选择的策略有关,还与局中人在整个局势中采取的一套政策有关。因此,一个博弈结束时每个参与人的“得失”是所有参与人设定的一组政策的函数,通常称为支付函数。
(4)对于游戏参与者来说,有一个游戏结果。
(5)博弈涉及均衡:均衡就是均衡,在经济学中,均衡就是相关的量处于一个稳定的值。在供求关系中,如果一个商品市场处于某个价格,在这个价格上想买这个商品的人都可以买,想卖的人都可以卖。这个时候,我们说这种商品的供求达到了平衡。所谓纳什均衡就是一个稳定的博弈结果。
纳什均衡:在一个策略组合中,所有参与者都面临着在别人不改变策略的情况下,他的策略是最优的情况。换句话说,如果他此时改变策略,他的支付就会减少。在纳什均衡点上,每个理性的参与者都不会有单独改变策略的冲动。证明纳什均衡点存在的前提是“博弈均衡对”的概念。所谓“均衡夫妇”,是指在两人零和博弈中,当局者A采用其最优策略a*,局者B也采用其最优策略b*。如果玩家A仍然采用b*,但是玩家A采用了另一个策略A,那么玩家A的支付不会超过他原来策略a*的支付。这个结果对于玩家b也是成立的。
这样,“均衡对”就明确定义为:一对策略a*(属于策略集A)和b*(属于策略集B)称为均衡对。对于任何策略A(属于策略集A)和策略B(属于策略集B),总有一个偶对(A,b*)≤偶对(a*,b*)≤。
非零和博弈也有以下定义:一对策略a*(属于策略集A)和b*(属于策略集B)称为非零和博弈的均衡对。对于任意一个策略A(属于策略集A)和策略B(属于策略集B),总有:偶对(A,b*) ≤偶对(a*,b*)玩家A;偶对(a*,b)≤游戏中玩家B的偶对(a*,b*)。
有了上面的定义,纳什定理就立即得到了:
任何有限纯策略的二人对策至少有一个均衡对。这个均衡对叫做纳什均衡点。
纳什定理的严格证明需要不动点理论,不动点理论是研究经济均衡的主要工具。一般来说,找到平衡点的存在性就相当于找到了博弈的不动点。
纳什均衡点的概念提供了一个非常重要的分析方法,使得博弈论研究能够在一个博弈结构中找到更有意义的结果。
但是纳什均衡点的定义仅限于任何不想单方面改变策略的参与人,忽略了其他参与人改变策略的可能性。所以很多时候纳什均衡点的结论是没有说服力的,研究者形象地称之为“天真可爱的纳什均衡点”。
R Selten按照一定的规则剔除了多个均衡中一些不合理的均衡点,从而形成了两个精炼的均衡概念:子博弈完全均衡和颤抖手完美均衡。
游戏类型
(1)合作博弈——研究人们达成合作时如何分配合作的利益,即收益分配问题。
(2)非合作博弈——研究在利益相互影响的情况下,人们如何做出决策,使自己的利益最大化,即策略选择。
(3)完全信息和不完全信息的博弈:玩家对所有参与者的策略空间和策略组合下的支付都有充分的了解,称为完全信息;反之,则称之为信息不完全。
(4)静态博弈和动态博弈
静态博弈:指参与者同时采取行动,或者虽然有先后顺序,但后一个行动者不知道前一个行动者的策略。
动态博弈:指双方的行动顺序,后一个行动者可以知道前一个行动者的策略。
财产分布与Shapley值
考虑这样一个合作博弈:甲、乙、丙、丙投票决定如何分配654.38+0万元,他们分别有50%、40%、654.38+00%的权力。根据规则,一个方案只有在超过50%的投票赞成时才能通过。那么如何分配才合理呢?根据票数分布,50万、B40万、C65438+10万C向A提出:70万、b0、C30万B向A提出:80万、B20万、c0……...
权力指数:每个决策者在决策中的权力体现在他的获胜联盟中“关键进入者”的数量上,“关键进入者”的数量称为权力指数。
Shapley值:在各种可能的联盟秩序下,参与者对联盟的边际贡献之和除以各种可能的联盟组合。