分钱难题改变数学:文艺复兴时期一场赌博纠纷竟然催生概率论


“赌博”这个贬义词竟然催生“数学”这个阳春白雪词语:一场没赌完的硬币游戏,顺手搞出了概率论!本文讲述文艺复兴时期一场赌博纠纷如何催生概率论,通过帕斯卡和费马的通信,揭示公平分赌注问题的数学解法及其对现代风险评估的深远影响。

作者背景  
杰克·默塔夫,科普作家,专注数学史与概率论,长期为《科学美国人》等媒体撰稿


一个硬币游戏引发的数学血案

话说有一天,两个哥们儿闲得无聊,掏出50美元说玩个抛硬币游戏。规则很简单:抛硬币看正反面,正面A得分,反面B得分,谁先攒够某个分数,桌子上的100美元就全归谁。这听起来是不是特别公平?每人出一样多的钱,规则对两边都一样,完美!

结果玩到一半,出大事了。突然有人敲门说要查水表,或者房东来收租了,反正游戏必须立刻停止。这时候问题来了:桌子上的100美元怎么分?领先的人说“我分数高,应该多拿”,落后的人说“比赛没打完,我还有机会翻盘,不能按现在比分分”。两个人谁也不服谁,眼看就要从动嘴变成动手。

这看起来就是个日常小纠纷,街边棋摊天天都有。但这帮数学家一琢磨,发现事情没那么简单。

这个问题表面上是分钱,实际上是问一个超级烧脑的问题:未来的可能性到底值多少钱?现在的比分是事实,但没发生的比赛里藏着各种可能的结果,怎么把这些可能的结果折现成现在的钱?这就像问一个还没开奖的彩票值多少钱,问明天股价涨跌现在值多少钱,问一个创业公司未来的梦想现在值多少钱。

这个问题如果解决不了,整个保险行业、金融行业、甚至买彩票的彩票站都没法合理定价。



按比分分钱?太天真了

最早期的思路特别朴素,甚至可以说有点憨。这帮人想:既然已经打了一部分,那就按现在的分数比例分钱呗。比如目标是10分,现在A是6分B是4分,那就A拿60美元B拿40美元。听起来很有道理是不是?已经发生的成绩就是铁一般的事实,按照功劳分配,公平合理,小学生都能理解。

但仔细一想,这个方案漏洞大到能跑马。假如比赛刚刚开始,A得了1分B得了0分,按照这个逻辑,A拿走全部100美元,B一分钱没有。这合理吗?只领先一分就全拿,那谁还愿意继续玩?更极端的情况,两个人还没开始,比分0比0,按比例分就是除以零,直接崩溃。这个方案的毛病在于,它只看了已经发生的事情,完全无视未来还有一堆没扔的硬币。领先一分不代表最终一定能赢,因为后面的硬币完全可能翻盘。这种方法本质上是用过去否定未来,数学上叫短视,生活里叫耍赖。



看距离胜利还差几步?还是不够聪明

后来有人改进了一下:不看现在的比分,看每个人距离胜利还差几分。比如目标10分,A有6分还差4分,B有4分还差6分。那就按还差的分数的反比例来分钱,差得少的拿得多,差得多的拿得少。这样算下来,A拿60美元B拿40美元,跟刚才结果一样?纯粹巧合。

这个方法的进步在于,它开始关注“终点”而不是“起点”,关注未来还需要努力多少,而不是过去已经干了多少。听起来是不是有点现代项目管理的意思了?但问题依然存在。假如目标10分,A有9分还差1分,B有0分还差10分。按这个逻辑,A拿90.9美元,B拿9.1美元左右。表面上看A拿大头没问题,但仔细想,A只差一分就赢了,胜率应该极高,为什么只拿九成?实际上A的胜率远远超过九成,因为只要下一把硬币不是倒霉到极点,A就赢了。这个方法低估了接近终点的巨大优势,因为它还是在用一种线性的视角看问题,没有真正理解概率的指数级差异。



真正开窍:别盯着现在,去看所有可能的未来

数学家帕斯卡和费马这对搭档终于开窍了。他们意识到一个关键点:现在比分根本不重要,重要的是未来所有可能的结果路径。这就像下棋,高手不看当前棋盘上谁多吃了一个兵,而看未来所有可能的走法。想要公平分钱,就必须列举出从当前局面出发,所有可能的比赛结局,然后数一数A赢的路径有多少条,B赢的路径有多少条,按这个比例分钱。

这个思路的转变是革命性的。它把问题从“静态分配”变成了“动态预测”,从“看过去”变成了“看未来”,从“直觉判断”变成了“系统枚举”。这个转变的价值怎么强调都不为过,因为它标志着人类第一次用数学结构化的方式来处理不确定性。不是靠算命、不是靠直觉、不是靠拍脑袋,而是靠穷举所有可能性。从此以后,随机事件不再是神秘的、不可捉摸的,而是一个可以被拆解、被计数、被计算的对象。这就是概率论诞生的真正瞬间。



穷举法:暴力但有道理

具体怎么操作呢?假如现在比分是A差1分赢,B差2分赢。也就是说,A只要再赢一把硬币就结束,B需要连赢两把才能翻盘。这时候可以穷举所有可能的后续抛硬币结果。最多再扔两把就一定出结果,因为要么A第一把就赢了,要么A第一把输了但第二把定胜负。所有可能的情况是:第一把A赢、第一把B赢第二把A赢、第一把B赢第二把B赢。

数一下,A赢的情况占了两种,B赢的情况只占一种。所以A的胜率是三分之二,B的胜率是三分之一。按这个比例,A拿66.7美元,B拿33.3美元。这个结果跟之前所有的直觉方法都不一样,而且逻辑上站得住脚。这个方法的牛逼之处在于,它不依赖任何主观判断,纯靠数数。只要把所有可能的未来路径列出来,数清楚每个玩家赢了多少条路径,答案就出来了。裁判可以拿着这个结果给吵架的两个人看,谁都没话说,因为数学不会骗人。



穷举法的死穴:路径爆炸

穷举法虽然逻辑完美,但有一个致命缺点:当剩余比赛轮数变多的时候,可能的路径数量会像核爆一样疯狂增长。每多扔一次硬币,路径数量翻一倍。假如还需要扔10次硬币,那就是2的10次方等于1024条路径。手算还能勉强接受。但如果还需要扔20次,那就是超过100万条路径。30次就是10亿条,40次就是一万亿条。这个增长速度叫做指数爆炸,人脑根本算不过来,连早期计算机都扛不住。

这就像一个侦探想要破案,理论上可以穷举所有嫌疑人的所有可能行动,但实际上一秒钟产生的新可能性比宇宙中的星星还多。帕斯卡和费马当然也发现了这个问题。他们知道,光靠暴力枚举走不远,必须找到一个更聪明的方法,用一种递归的、递推的结构来压缩计算量。这个需求催生了数学史上又一个伟大发明:期望值的递归思想。



逆向递推:从终局往前倒着算

这个新方法的核心思路像打游戏开挂:从比赛结束的状态往前倒着推。假设比赛已经进行到某一个中间局面,想知道当前这个局面的价值是多少,可以这样算:看下一步可能出现的两种结果,第一种结果对应的价值乘以发生概率,加上第二种结果对应的价值乘以发生概率,合起来就是当前局面的价值。

这就像问一个问题:一个苹果今天值多少钱?答案不是猜的,而是看明天这个苹果可能变成什么。如果明天有50%的概率变成两个苹果,50%的概率变成半个苹果,那今天的价值就是0.5乘以2加上0.5乘以0.5等于1.25个苹果。这个数字就是数学期望值。所有复杂的、看起来一团乱麻的问题,都可以这样一层一层往回倒,直到倒到那些确定已知的状态。这种方法把一个大问题拆成了一堆小问题,每个小问题都只是简单的加权平均,计算量瞬间从指数级降到了线性级。



期望值:把未来所有可能性装进一个数字

这个递推结构后来被正式命名为数学期望值。它用一句话概括就是:一个不确定事件的价值,等于所有可能结果的数值乘以该结果发生概率的总和。看不懂没关系,用大白话讲就是:把未来的每一种可能性都折现到现在,按可能性大小加权,最后加出一个数。

这个数的意义极其深刻。它意味着,即使未来是不确定的,即使一个单次事件的结果完全随机,仍然可以用一个确定的数字来描述它的平均价值。去买彩票,虽然不知道这次会不会中奖,但可以算出期望值是亏的,所以长期买彩票必输。去投资股票,虽然不知道明天涨跌,但可以算出某只股票的期望收益率。去开保险公司,虽然不知道哪个客户会出事,但可以算出所有客户的风险期望值,然后定一个稳赚不赔的保费。期望值把一团乱麻的不确定性压缩成了一个干干净净的数字,这就是它被称为概率论皇冠上明珠的原因。



两个方法算出同一个结果,概率论正式成立

帕斯卡和费马用两种完全不同的方法算同一个分赌注问题,一个用穷举路径,一个用逆向递推,结果居然一模一样。这件事的意义比结果本身大得多。因为如果两种方法结果不一致,那就说明逻辑有bug,整个理论框架就是空中楼阁。但结果一致,说明这个框架是自洽的、可靠的、经得起推敲的。

从此以后,概率论不再是几个数学爱好者的脑洞游戏,而是一门正经的科学分支。它的核心思想可以用一个漂亮的主谓宾结构来表达:任何随机决策的价值由所有可能结果的概率加权平均值确定。这个陈述简洁、清晰、可验证、可计算。任何学过概率论的人都能用这句话解释为什么赌场总是赢,为什么保险公司不会破产,为什么天气预报说降水概率30%不等于30%的地方会下雨。



从赌场走向全世界

数学期望值这个发明很快就冲出了赌桌,像病毒一样扩散到所有需要面对不确定性的领域。保险行业第一个接住了这个宝贝。精算师的工作本质上就是:计算每种风险发生的概率,计算风险发生后的损失金额,然后用期望值公式算出公平保费。比如一个年轻人出车祸的概率是1%,车祸平均损失10万元,那公平保费就是1000元左右。加上运营成本和利润,就是客户每年交的保费。整个保险业的大厦就建立在期望值这块基石上。

金融市场更是把期望值玩出了花。股票定价、债券定价、期权定价、风险投资估值,背后的数学工具无论多复杂,归根结底都在做一件事:估计未来的所有可能情景,给每个情景赋予概率,然后计算期望值。巴菲特买股票不是猜涨跌,而是估算公司未来所有可能的现金流,加权平均后得到一个内在价值,然后跟当前股价比。量化交易公司用高频数据计算毫秒级别的期望值,赚的是统计套利的钱。没有期望值,整个金融行业就回到了靠算命和拍脑袋的时代。



创业公司和梦想也能被定价

最神奇的应用场景是风险投资。一个初创公司今天可能一分钱收入都没有,甚至产品都没做出来,凭什么估值10个亿?答案是期望值。投资人会设想这个公司未来可能的所有结局:有90%的概率倒闭血本无归,有9%的概率勉强活着赚点小钱,有0.9%的概率被收购赚10倍,有0.09%的概率成长为行业巨头赚1000倍,有0.01%的概率成为垄断巨头赚10000倍。把这些概率乘上对应的回报,加起来得到期望值,就是这个公司今天的合理估值。

这个逻辑完美解释了为什么风险投资人看起来像疯子一样投一堆注定会倒闭的公司。因为单看一个公司大概率是亏的,但投资组合的期望值是正的。就像一个赌场不在乎单个赌客赢钱,只要长期期望值为正,赌场就稳赚。期望值的思维方式让人类可以在极度不确定的环境中做出理性决策,不需要预测未来,只需要知道概率分布就够了。这种能力在古代只有巫师和神棍才敢自称拥有,现在任何一个学过高中数学的人都能算。



不确定性不再可怕

概率论和期望值给人类社会带来的最大改变,不是具体的技术或公式,而是一种看待未知世界的方式。在概率论诞生之前,不确定性意味着不可知、不可控、只能听天由命。洪水来了就是天灾,生病了就是天谴,生意失败了就是时运不济。这种思维方式让人永远处在被动挨打的位置。

但有了期望值这个工具之后,不确定性变成了一个可以被拆解、被量化、被管理、被对冲的对象。这不是说人类能预测未来了,而是说人类可以在不预测未来的前提下做出最优决策。不需要知道明天会不会下雨,只需要知道降水概率30%就够了。不需要知道哪只股票会涨,只需要知道期望收益率最高的资产组合就够了。不需要知道这个客户会不会违约,只需要知道所有客户的违约概率分布就够了。这种思维方式的转变,让人类从命运的奴隶变成了概率的主人。



全文总结

概率论起源于分赌注问题,核心是用期望值对所有可能结果加权平均,从而将不确定性转化为可计算的定价工具。



附:关键源码与公式示例

以下是一个简单的Python函数,用于模拟分赌注问题的期望值递归计算:

python
def expected_value(score_a, score_b, target_a, target_b, prob_a=0.5):
    # 如果A已达到目标,返回1(表示A赢得全部赌注)
    if score_a >= target_a:
        return 1.0
    # 如果B已达到目标,返回0(表示A赢得0)
    if score_b >= target_b:
        return 0.0
    # 递归计算期望值:当前值 = 下一步A赢的概率 * A赢后的期望 + 下一步B赢的概率 * B赢后的期望
    return prob_a * expected_value(score_a+1, score_b, target_a, target_b, prob_a) + (1-prob_a) * expected_value(score_a, score_b+1, target_a, target_b, prob_a)

# 示例:A差1分赢,B差2分赢,A获胜的期望概率
print(expected_value(0, 0, 1, 2))  # 输出约0.6667

命令行执行示例:

bash
python gambling_problem.py
0.6666666666666666

文件结构说明:


probability_origin/
├── README.md          # 项目说明
├── gambling.py        # 分赌注问题递归解法
└── simulation.py      # 蒙特卡洛模拟验证

极客一语道破

这篇文章虽然没有肯定赌博一定是数学概率论的催生原因,但是至少是数学应用的最日常化场景,如果你被道德束缚,做一个表面上道德高尚的人,实际是自我设限的人,那么你学了初中数学后,如果又不炒股投资,那么至今还是觉得没啥用处,辅导孩子学数学只能付出棍棒和高血压成本。