视频字幕
欢迎了解动态博弈论。动态博弈论是博弈论的一个分支,研究的是参与者在不同时间点上进行决策的博弈。与静态博弈不同,动态博弈中参与者的决策是序贯的,后续的决策者可以观察到之前决策者的行动,并且他们的策略是针对所有可能情况的行动计划。在右侧的博弈树中,玩家1先行动,选择行动A或B,然后玩家2根据玩家1的选择做出反应,最终导向不同的收益结果。
动态博弈通常用博弈树或扩展式来表示,它清晰地展示了决策序列和信息集。求解动态博弈的主要概念是子博弈完美纳什均衡,简称SPNE。它要求参与者的策略在博弈的任何子博弈中都构成纳什均衡。求解SPNE常用的方法是逆向归纳法。在这个例子中,我们首先分析博弈树底层玩家2的最优选择:如果玩家1选择A,玩家2会选择右侧获得2;如果玩家1选择B,玩家2会选择左侧获得3。然后,玩家1预见到这些反应后,会选择行动A,因为这样可以获得2而不是1。因此,子博弈完美纳什均衡是玩家1选A,玩家2在A后选右,在B后选左。
动态博弈可以根据信息结构分为几种主要类型。完全信息动态博弈中,所有玩家知道所有历史行动;而不完全信息动态博弈中,玩家可能不知道某些历史行动。完美信息动态博弈中,每个决策点只有一个节点;而不完美信息动态博弈中,存在信息集包含多个节点,表示玩家无法区分这些节点。动态博弈理论广泛应用于经济学、政治学和商业策略等领域。例如,在市场进入博弈中,新企业先决定是否进入市场,然后现有企业决定是降价对抗还是接受新进入者。通过逆向归纳法分析,我们可以预测均衡结果。
重复博弈是指同一博弈重复多次进行,参与者可以观察到历史行动,这允许他们建立声誉并实施惩罚。在重复博弈中,承诺和威胁变得非常重要。可信承诺是指参与者预先限制自己的行动选择,而可信威胁确保威胁在需要时会被执行。这些策略工具可以影响对手的预期和行为。囚徒困境是研究重复博弈的经典例子。在一次性博弈中,双方都选择背叛是唯一的纳什均衡,但在无限重复博弈中,合作可能成为均衡。常见的策略包括'以牙还牙',即模仿对手上一轮的行动,以及'严厉触发',即一旦对手背叛就永远背叛。民间定理表明,在无限重复博弈中,如果贴现因子足够大,几乎任何可行且个体理性的收益组合都可以成为子博弈完美均衡。
总结一下,动态博弈论研究参与者在不同时间点上进行决策的博弈,其中决策是序贯的,后续决策者可以观察到之前的行动。动态博弈通常用博弈树或扩展式来表示,其主要求解概念是子博弈完美纳什均衡。逆向归纳法是求解动态博弈的主要方法,它从博弈树底部开始,向上分析每个决策点的最优选择。动态博弈可以根据信息结构分为完全信息与不完全信息博弈,以及完美信息与不完美信息博弈等不同类型。在重复博弈中,参与者可以通过建立声誉和实施惩罚来影响对手行为,而承诺机制则允许参与者预先限制自己的行动选择,从而战略性地影响博弈结果。动态博弈理论在经济学、政治学和商业策略等多个领域有着广泛的应用。