今天的课堂,和蔼教授将带领叶寒、秦易、许黑、蒋尘、周游五位同学,以博弈论为核心,拆解“一次游戏”与“多次游戏”的不同玩法。我们会从考试作弊的收益计算切入,结合商业监管、体育赛事的真实案例,穿插心理学的“即时满足偏差”、哲学的“功利主义与义务论”,最终理解:人生是场“无限游戏”,所谓“远见”,就是不用一次游戏的策略应对多次挑战,不用有限规则套无限未来。
上课铃刚落,教授手里拿着一张模拟试卷走进教室,笑着问:“同学们,有没有人曾想过‘就作弊这一次,应该不会被发现’?或者觉得‘偶尔钻次规则空子,没什么大不了’?”
秦易有点不好意思地举手:“教授,我初中时一次数学测验没复习好,就偷偷看了同桌的选择题,当时觉得‘就一次,分数上去就行’,后来没被发现,还庆幸了好久。”
许黑也点头:“我身边有人打游戏时用外挂,说‘就爽这一局’,结果后来被封号了,之前攒的装备全没了。”
教授点点头:“这就是我们今天要聊的核心——一次游戏和多次游戏,玩法天差地别。很多人栽跟头,就是把‘多次游戏’当成了‘一次游戏’来应对。我们先从博弈论的基础说起,博弈论分两类:零和游戏(比如下棋,你赢我输)和非零和游戏(比如合作做生意,可能双赢、双输,也可能一赢一输)。大家常说‘追求双赢’,但非零和游戏里,有个很有意思的现象:‘双输’反而最容易稳定,这就是纳什均衡。而要实现双赢,不仅要理性,更要‘敢信对方不耍赖’——但生活里的博弈,大多不是‘一锤子买卖’,而是反复进行的‘多次游戏’,这时候策略就得变了。”
“我们先算笔账,就用考试作弊的例子。”教授在黑板上写下假设条件,“假设全班只有张三作弊,被发现概率5%。没被发现,他多拿10分(收益+10);被发现,得0分(损失-100)。大家算算,一次考试里,张三作弊的‘收益期望’是多少?”
蒋尘拿起笔飞快计算:“10乘以95%,减去100乘以5%……10×0.95=9.5,100×0.05=5,所以9.5-5=4.5?那他作弊好像赚了?”
“没错,一次游戏里,期望收益是正的4.5,看起来‘合算’。”教授话锋一转,“但如果考试不是一次,而是k次呢?比如10次、20次、30次,而且只要有一次被发现,之前所有分数清零,损失是100k。大家再算10次考试的情况:全部作弊成功的概率是95%的10次方,大概60%;收益是10×10=100,损失是100×10=1000。期望收益就是0.6×100 - (1-0.6)×1000=60-400=-340?不对,教授,我是不是算错了?”
教授笑着纠正:“公式应该是‘成功时的收益×成功概率 - 失败时的损失×失败概率’,也就是0.95^k×10k - (1-0.95^k)×100。当k=10时,0.95^10≈0.6,所以0.6×100 - 0.4×100=60-40=20,这时候期望还是正的。但k=20时,0.95^20≈0.36,0.36×200 - 0.64×100=72-64=8,快接近零了;k=30时,0.95^30≈0.21,0.21×300 - 0.79×100=63-79=-16,这时候就亏了;k=100时,0.95^100≈0.0059,0.0059×1000 - 0.9941×100≈5.9-99.41=-93.51,几乎肯定亏。”
叶寒皱眉:“可现实里,有人会想‘我就作弊一次,以后再也不做’,这样不就只承担一次风险吗?”
“这就涉及到心理学里的‘即时满足偏差’和‘行为强化效应’。”教授解释道,“人天生更看重‘眼前的好处’,而忽略‘未来的风险’——一次作弊成功,拿到高分的‘甜头’会强化这个行为,下次遇到没复习好的情况,就会忍不住再试。就像有人第一次闯红灯没被撞,下次就更容易闯红灯;第一次撒谎没被拆穿,下次就更容易撒谎。行为心理学里有个‘操作性条件反射’:得到正反馈的行为,会反复出现。所以‘只作弊一次’的想法,大多是自欺欺人。”
“那怎么才能阻止这种‘侥幸心理’?”周游问,“是不是只能靠加大处罚?”
“加大处罚是关键,但更重要的是‘改变游戏规则’——让‘一次作弊的损失’覆盖‘所有过往收益’。”教授举例子,“英美股市为什么健康?因为一旦发现财务造假,不仅要没收这次的非法所得,还要罚到倾家荡产,甚至追究刑事责任。比如安然公司造假,高管坐牢,投资者获得巨额赔偿,公司直接破产——这种‘一次作弊就清盘’的规则,让大多数人不敢冒险。再看美国的假货少,不是因为美国人道德高,而是一旦造假被发现,要向所有消费者赔偿,比如某品牌奶粉造假,可能要赔几千万美元,一次就倒闭。”
小主,这个章节后面还有哦,请点击下一页继续阅读,后面更精彩!