常见的博弈模型

 

囚徒困境

1
2
3
4
5
6
问题与条件:两犯人被抓后被关在不能交流的不同牢房里进行审讯,假设若两人全不招则都只关一年。两人全招供则都关五年。一人招供一人沉默则招供者立刻释放,沉默者单独关十年。
最终的结果会是两人全招供都被关五年。虽然无法利益最大化,但可以让损失最小化。

经典的案例:人类最优解是消除所有核武器,最差解是互相扔核武器,实际选择是都持有核武威慑确保相互毁灭。

囚徒困境是典型的非零和博弈,非零和博弈又分为正和博弈和负和博弈,正和博弈就是双赢,负和博弈就是双输。

斗鸡模型 / 胆小鬼博弈

1
2
3
问题与条件:两方都只有 [进攻] 和 [撤退] 两个选择,若一方进攻而另一方撤退,则进攻方获胜。若双方均进攻则共同承担极大损失。若双方均撤退则共同承担较小代价。

问题与条件:两人开车在同一条车道上对向行驶,若一方不动而另一方转向,则转向方被耻笑为胆小鬼。若双方均不转向任由两车相撞则同归于尽。若双方均转向则无事发生。

赌徒博弈 / 零和博弈

1
2
3
4
问题与条件:参与者的利益完全对立,一方有收益,另一方肯定有损失,并且各方的收益和损失之和永远为零。

经典的案例:零和博弈双方不是你死就是我亡,象棋围棋,赌博游戏,股票市场,体育比赛,政治选举,法律谈判

智猪博弈 / 搭便车博弈

1
2
3
4
5
6
7
8
9
10
问题与条件:猪圈里有大小两头猪,猪圈的一边有个踏板,它们每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。
如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物。
若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。

问题与条件:若踩踏板和吃食物之间有冷却时间,大猪在冷却时间内可吃掉出100%的食物,小猪在冷却时间内只能吃掉出30%的食物,则最终小猪会等大猪去踩踏板
大猪多出力的并没有多得,小猪少出力的也没有少得,大猪即使知道结果也不得不这么做,现实中大公司也耗不过小公司。

经典的案例:大猪Meta Quest在前面开发VR市场吃肉,小猪Pico们在后面喝汤。股市上等待庄家抬轿的散户。腾讯代理或山寨某些爆款游戏。

经典的案例:三国大猪孙权联合小猪刘备抵抗曹操,孙权需要皇叔的名声来对抗曹操的挟天子以令诸侯,居无定所的刘备从此腾飞至三国鼎立。

酒吧博弈 / 少数派博弈

1
2
3
4
问题与条件:有一群人每个周末都要决定去酒吧还是待家里,这群人不存在信息交流不知道他人的选择,且该酒吧座位或酒水等有限
如果大部分人都去酒吧那么去酒吧体验就会很差,这时待家里收益就大于去酒吧。如果只有少部分人去酒吧那么去酒吧体验就不错,这时去酒吧收益就大于待家里

经典的案例:节假日高速免费大堵车,拥堵时导航带你走小路,股市的羊群效应,高考的大小年

猎鹿模型 / 信任困境

1
2
3
问题与条件:两个猎人只能狩猎兔鹿两种猎物,猎鹿需双方协作但获得高收益(各自吃10天),单独猎兔收益较低但风险更小(各自吃4天)。

最终的结果:那么存在两个纳什均衡点,共同猎鹿或各自猎兔。在这里双赢是存在的但得有双赢的意识或利他的思维

鹰鸽模型

1
2
3
问题与条件:鹰凶猛好斗,绝不退让。鸽温顺善良,避免冲突。哪个习性更适合生存呢?鹰鹰相遇至死方休。鹰鸽相遇鸽会退让。鸽鸽相遇各退一步。

最终的结果:鹰的世界:弱肉强食的黑暗丛林。鸽的天堂:没战斗力的乌托邦。鹰鸽共生:既能保持战斗力又不至于好战而玩脱。反例如宋朝重文轻武,元朝重武轻文。

枪手博弈

1
2
3
4
5
问题与条件:三个无法沟通的西部牛仔持枪对决,要求是三人必须同时开枪且每轮每人只能开一枪。假设甲十发八中,乙十发六中,丙十发四中,那么一轮后谁幸存概率更大?

最终的结果:甲乙会互射,丙可活下来。三国演义中关羽华容道义释曹操也是类似,曹操要无了刘备就要直面孙权的炮火,曹操还在的话继续三足鼎立。

相关的感悟:要保持博弈均衡状态,强者不去对抗其他强者反而逮着弱者捏,那么就会被其他强者干掉。弱者不自量力去挑战强者,很可能在打破平衡后变成第一个牺牲品。

懦夫博弈

1
2
3
问题与条件:多方同时竞争一个标,获胜方可得100%收益,而失败方零收益。

最终的结果:若两方针锋相对而被第三方了捡便宜那么它们两方收益都为零,如果双方合作则可各得50%收益。

多人博弈

1
2
3
问题与条件:一个和尚挑水喝,两个和尚抬水喝,三个和尚没水喝。南郭先生的滥竽充数

相关的感悟:公平分配很重要,个人的自私自利会对集体不利,集体中人们都倾向于少劳多得,因为多劳未必多得,所以滥竽充数的必然存在。

分蛋糕博弈

1
2
3
问题与条件:两个馋嘴的孩子间该如何分一块蛋糕?

解决的方法:让一个孩子切蛋糕,让另一个孩子先选。出于贪心切的孩子很公平,且不会对两块蛋糕是否一般大提出异议;第二个孩子也不可能抱怨,因为他拿的那一块是自己挑的。

帆船博弈

1
2
3
4
5
6
7
某年美国和澳大利亚进行帆船比赛,往年都是澳大利亚获胜,美国为了这次比赛,做了很多的努力,改进技术,换老船长上前指挥等等。
果然,这一次,美国队一路领先,径直向前。在离终点还有3海里的时候美国队领先澳大利亚队4海里。眼看着马上要胜利了,这个时候海上刮起了一阵大风。
帆船是要根据风的方向调节帆的方向才能前进的。海上的风有两种,一种是阵风,一种是旋风。阵风过来的时候调帆,旋风不用调帆,因为旋风会使帆刮过来再刮过去,调了也白调。
这个时候怎么办呢?是调帆还是不调?老船长根据自己多年的经验,说这是阵风,于是调帆。但是等帆调整好以后,风向又变了,这是一种阵风式的旋风。
于是美国队的帆船在原地打转,浪费了很多时间。这个时候澳大利亚队的帆船赶上来了。澳大利亚队没有调帆,一路向前超过了美国队赢得了胜利。

相关的感悟:维持领先地位的最可靠的方法就是看追赶者怎么做你就跟着怎么做。

其他名词

1
2
3
4
5
6
7
8
9
帕累托最优:在没有人变差的前提下,让有些人更好。(先富带动后富)
纳什 均 衡:所有参与博弈的人都为了满足自己的个人利益而选择牺牲集体利益而导致的全体参与人都吃亏的均衡状态。(要死一起死)

三种博弈策略:在交替型(双方轮流决策)的博弈中 宽容以牙还牙 是最优的策略,同步型(双方同时决策)的博弈中 赢定输赢 是最优的策略。
以牙还牙:你怎么对我,我就怎么对你
宽容以牙还牙:大体上遵循你怎么对我,我就怎么对你的思路,不过偶尔也会原谅对方的恶行。
赢定输赢:如果我赢了就保持上一步的策略。如果我输了就改变策略。如果我们都保持合作,那么下一步继续合作,如果我被背叛,那么下一步我也背叛

沉没成本不参与重大决策,已有损失不影响当期决策