每天几千万人玩Wordle,就是那个猜五个字母单词的小游戏。纽约州立大学宾汉姆顿分校一帮搞信息论的研究生和教授,用香农熵整了个办法,99%的题都能赢。他们不猜最可能的词,专挑信息量最大的词下手。
这游戏到底怎么玩
Wordle每天就一道题,全球玩家都一样。六个格子,猜五次,目标是蒙出一个五个字母的英文单词。第一次猜的时候,脑子里一片空白,屏幕上五个横线,啥提示都没有。你只好瞎打一个词,比如BRAVE。打完回车,游戏给你反馈,颜色会变。
灰色代表这个词里压根没这个字母。黄色说明字母在答案里,但位置不对。绿色说明字母对了且位置也对了。然后你根据这些颜色提示继续猜。直到五个格子全绿,你就赢了。或者六次机会用光,屏幕弹出答案,你只能干瞪眼。
这游戏去年被纽约时报买了之后更火了。每天朋友圈一堆人晒绿色方块,看着特有成就感。但你知道这背后其实是个信息题吗?每猜一次,你就在获取信息。灰色告诉你排除一个字母,黄色告诉你字母存在但挪个位置,绿色则是准确定位。每次反馈都在削减可能性。
如果运气好,第一把直接蒙对,那概率是五万分之一左右。如果运气不好,灰色一堆,可能到最后都猜不出来。但这帮研究人员发现,运气是可以被信息论取代的。你不需要蒙,你可以算。
这帮人到底怎么破解的
带头大哥叫吴淦宇,是宾汉姆顿大学系统科学系的助理教授。他带着一个博士生和一个硕士生,搞了篇论文,发在《东北复杂系统杂志》上。他们用的核心工具叫香农熵。
熵这词听起来特别物理,什么热力学第二定律之类的,让人头大。但在信息论里,熵就是衡量不确定性的数学尺子。比如我问你,今天中午吃啥,你脑子里一大堆选项,面条米饭汉堡沙拉,这时候不确定性极高,熵很大。如果我告诉你,食堂今天只开面条窗口,那你瞬间就知道该吃啥了,不确定性降低,熵变小。
这帮人把这个逻辑套在Wordle上。每次猜词之后,游戏反馈回来的颜色组合会把可能的答案分成不同类别。好的猜词,就是能把可能性压缩得最狠的那个词。哪怕这个词本身完全不可能是答案,但只要它能帮你排除掉最多选项,它就是好词。
这个想法特别反直觉。绝大多数人玩Wordle,第一反应是猜一个像CRANE、SLATE这种常见字母多的词,指望直接蒙对。但这帮人反着来,他们故意猜一些看着很怪、基本不可能中奖的词,只为了获取信息。比如QAJAQ这种,全是冷门字母,普通人根本不会往那想,但在他们的算法里,这类词提供的信息量可能爆炸。
信息量是怎么算的
要理解这办法,得先明白什么叫信息量大的词。
在香农熵的框架下,一个词的信息量取决于它能把候选答案库分成多少种不同的反馈模式。每个反馈模式就是一个颜色组合,比如第一个字母灰第二个绿第三个黄第四个灰第五个灰。这个组合越分散,说明这个词把可能性筛得越均匀,你得到的后续信息就越多。
假如你猜一个词,结果百分之九十的反馈都是全灰,只有百分之十有颜色,那这个词就一般般,因为它没帮你区分出太多子集。但如果你猜一个词,反馈均匀分布在十几种组合里,那不管最后反馈是哪种,你都把候选词缩减了一大截。这就像玩二十问游戏,你问一个特别泛的问题,比如它是个动物吗,如果回答是,你还要继续细分。但如果你问它是有脊椎的吗,这时候分类就更精细。
论文里把每个可能的答案词都算了一遍熵值,然后排序。熵值最高的那个词,就是他们推荐你下一个要猜的词。这个计算量其实不小,因为答案库有两千多个词,每次猜完还要重新算。但他们已经把这个过程写成脚本了,你一边玩一边把反馈输进去,程序直接吐出来下一个词。
有个博士生叫唐纳德·斯蒂芬斯,他打了个比方。他说,你猜一个词,之前的猜测会排除一大堆选项,基于剩下的选项,猜某些词会让你更快地获得信息增益。关键洞察是,这个词不非得是正确答案,它只需要信息丰富。这个点太微妙了,但特别重要。
普通人玩游戏,目标是我要猜中。他们玩游戏的逻辑是,我要把可能性缩小到最小。目标不一样,行为就完全不一样。普通人盯着正确答案,他们盯着信息流。
模拟结果有多夸张
他们把这种策略和传统策略放在一起模拟。传统策略就是猜常见字母多的词,比如A、E、R这种高频字母的组合。模拟跑下来,他们的熵策略赢了百分之九十九的谜题,传统策略只赢了百分之九十。
别小看这百分之九的差距。Wordle每天一题,一年三百六十五题,百分之九十的成功率意味着你一年会输三十六次。百分之九十九的成功率意味着你一年只输三次。这差距相当于业余选手和职业选手的区别。
更厉害的是,他们的办法不光赢得多,还赢得快。平均猜几次能中呢?论文没直接给平均数,但提到这种策略往往能在更少的猜测次数内解开。因为每猜一次,信息量都最大化,你就不太会浪费猜测在那些无效的词上。
普通玩家经常陷入困境,比如猜了四个词,全都是灰色和黄色,还剩一堆可能性,不知道该往哪个方向走。熵策略不会这样,它每一步都指向最优路径,就像导航一样,虽然有时候导航让你走一条特别奇怪的小路,但最后确实更快到达目的地。
课堂作业怎么变成论文的
更有意思的是,这篇论文最初不是啥科研项目,就是个课堂作业。吴淦宇教授上信息论课,给学生布置了个任务,用信息论解决一个实际问题。这帮学生选了Wordle,因为当时这游戏刚火起来。
他们先搞了个基础版本,然后在课上展示。吴教授一看,哎,这玩意儿有点东西啊,就鼓励他们继续深挖。学生塔拉勒·阿拉达伊莱说,这论文从课堂作业变成发表成果,说明了他们系的教学水平。课程不光教概念,还推着你去做有实际影响的应用。
这种从课堂到期刊的路径其实挺少见的。大多数课程作业做完就扔了,没人会再管它。但信息论这个东西特别适合Wordle,因为它本来就是个信息博弈。你每猜一次,就是在做一次信息查询。反馈就是查询结果。整个游戏就是一个信息论实验场。
吴教授自己也说,这个项目好就好在,它把一个科学领域的静态测量工具,转化成了一个动态解决方案,帮人们更好地完成一个流行任务。这体现了团队对课堂材料的深刻理解和作为工程师的天赋。这话虽然听着像官方夸赞,但确实说到点子上了。
你该怎么用这个办法
假如你现在就想用这个办法玩Wordle,你得跑一个脚本。这个脚本在旁边运行,你把游戏里每次的颜色反馈输进去,它就吐出来下一个词。你不需要自己算熵,脚本帮你算好了。
脚本的逻辑是这样的。初始时,它有一个包含所有可能答案的列表。你第一次猜一个词,比如SOARE,然后把游戏反馈的颜色组合输入脚本。脚本根据这个组合,从答案列表里筛掉所有不符合的词,剩下新的候选列表。然后它重新计算这个新列表里每个词的熵值,挑出最高的那个作为下一次猜测。你继续猜它推荐的词,继续输入反馈,循环往复,直到猜中。
这个过程听起来挺麻烦,因为你要在两个设备之间切换。但如果你在电脑上玩,开两个窗口就行。一个窗口是游戏页面,另一个是终端跑脚本。你手动把颜色转成字母,比如G代表绿,Y代表黄,X代表灰,然后输进去。脚本一秒就吐出下一个词。
当然,也有纯粹靠脑子的玩法。你可以记住一些高频信息词,比如AUDIO、SOARE、ROATE、RAISE这些。这些词元音多,覆盖的字母组合多,虽然不是熵最优,但比瞎猜强。普通人如果不想跑脚本,用这几个词开头,成功率也能提高不少。
不过,严格来说,如果你真的跑他们的脚本,那就等于在作弊。因为这相当于你在用计算机算力碾压游戏设计者的智力。Wordle设计的时候,答案库是固定的,两千多个词,每个词被选为答案的概率是均等的。脚本把整个库都算了一遍,找出了最优策略。你照着猜,基本上稳赢。
这办法有啥局限
当然,这个办法不是完美的。
第一个问题是,它需要实时输入反馈,并且依赖完整的答案库。如果游戏更新了答案库,加入新词或者删掉老词,那算法就得重新跑一遍。不过Wordle的答案库相对稳定,纽约时报买了之后也没大改,所以问题不大。
第二个问题更微妙。这个策略最大化的是信息增益,而不是最小化猜测次数。什么意思呢?就是说,它保证你在六次之内赢的概率最大,但不保证你每次都用最少的次数猜中。有时候为了获取信息,它会让你猜一个特别偏的词,这个词占了你一次机会,但让你下一步能精准命中。总次数可能不是最优的,但赢的概率是最优的。
这就像下棋的时候,有些棋手走稳健的交换棋,牺牲一个子但获得局面优势。熵策略就是这么走的,它牺牲一次猜测机会,换取巨大的信息优势。普通玩家可能会觉得,猜一个肯定不对的词好蠢啊,但实际上这是最聪明的走法。
还有一个实际问题是,普通玩家根本不会去算熵。这玩意儿虽然概念简单,但真要手动算,得做一大堆乘法加法。所以这方法更多是个理论上的最优解,对实际玩家的帮助有限。除非你真的愿意在旁边跑脚本,或者把他们的推荐词表打印出来背熟。
不过,这论文最大的贡献不是教你怎么作弊。它展示的是信息论怎么从一个抽象的数学概念变成一个日常工具。你不需要理解熵的公式,你只需要理解它的思想,就是每次做选择的时候,选那个能给你最多新信息的选择。这个思想不光能用来猜词,还能用来做各种决策。
信息论还能干点啥
香农熵这玩意儿,自从被克劳德·香农在1948年提出来之后,已经被用到各种奇奇怪怪的地方了。除了通信工程、数据压缩这些老本行,现在还有人用它来选股票、优化物流、做机器学习特征选择,甚至分析音乐和文学风格。
在Wordle这个例子里,信息论的角色特别直观。因为游戏的反馈是明确的,候选集合是有限的,计算熵值相对容易。它不像现实世界里的问题那么模糊,比如你要不要换工作,没人能给你反馈颜色,候选选项也不是有限集合。但思想是共通的,就是尽量收集信息,推迟做决定,直到不确定性降低到可接受范围。
我们普通人做决策最大的毛病就是太急着下结论。猜一个词,中不中?不中,再猜一个。很少有人停下来想一想,我刚才猜的那个词给了我多少信息?我下一步该猜什么才能获得最多新信息?大多数人都是凭直觉走,觉得某个词顺眼就猜了。熵策略强迫你理性,它告诉你,顺不顺眼不重要,重要的是这个猜能筛掉多少候选。
吴教授他们这个团队,把这种理性思维包装成了一个可操作的方法。你不需要理解公式,只需要照着脚本做就行。
但更深层的价值在于,它让你意识到,不确定性是可以被测量的,信息是可以被计算的,最优策略是存在的。
为啥你该知道这事儿
就算你从来不玩Wordle,这研究也值得你了解一下。因为它背后的逻辑能迁移到很多场景。比如你要猜一个密码,或者要诊断一个故障,或者要搞明白一个复杂问题,你都可以用同样的思路,先做那个信息量最大的测试,而不是先做那个最可能直接成功的测试。
在故障诊断里,经验不足的维修工总喜欢直接换最可能的零件,换了不行再换下一个。有经验的维修工会先做快速测试,排除掉一大片可能性,再做下一步。前者靠运气,后者靠信息论。这两者的效率差距,跟Wordle里百分之九十和百分之九十九的差距是一样的。
再想想那些猜谜游戏、推理小说、悬疑电影,主角都是在不断收集信息,排除干扰项,最后锁定答案。如果有人每集都是瞎蒙,那这剧肯定不好看。好看的地方就在于信息一点点被揭示出来,不确定性一点点降低。Wordle这游戏之所以让人上瘾,也是因为这个过程被压缩到了五次猜测里,每次反馈都带来一点多巴胺。
所以下次你玩Wordle的时候,不妨试着用熵策略的思维来猜。别急着猜那个你觉得最像答案的词,先想想哪个词能帮你排除最多字母。哪怕你最后不跑脚本,光是这种思维转换,就能让你的胜率涨一截。
当然,如果你实在嫌麻烦,就记住几个高熵词。SOARE、ROATE、RAISE、CLINT、CRANE,这几个词覆盖的常用字母多,而且反馈模式分散,是很好的开胃菜。有人统计过,用SOARE开头,平均能在三点几次之内猜中。这虽然不是数学上的绝对最优,但已经比随机猜强太多了。
这研究最大的价值在哪
说到底,这论文教我们的不是怎么作弊,而是怎么思考。信息论是个强大的工具,但大多数人一辈子都不会碰它。吴教授他们用一个大家都喜欢的游戏,把这个工具介绍给了普通大众。这种科普效果比写一百篇科普文章都好。
你看,那些天天在社交媒体上晒Wordle成绩的人,他们可能压根不知道熵是什么。但如果有人告诉他们,有个办法可以让你百分之九十九赢,他们肯定会好奇。一好奇,就会去了解背后的原理。一了解原理,就会接触到香农熵、信息增益、不确定性这些概念。这不比上课生动多了?
而且这个研究有个特别好的点,它是从课堂作业来的。这说明好的教育不是灌知识,是给你一个工具,然后让你自己去找问题解决。这帮学生找到了Wordle,算出了最优策略,发表了论文。这整个链条非常自然,非常有说服力。
吴教授自己说的那句话特别对,他们把一个静态测量变成了一个动态解决方案。这句话翻译成人话就是,他们把数学课本上那个干巴巴的公式,变成了一个活生生的、能帮你赢游戏的方法。这种转化能力,才是工程师真正的本事。
总结一下,信息论帮Wordle玩家把胜率从九成提到九成九,靠的不是猜得更准,而是问得更好。每次猜词都是一次信息查询,最优查询不一定是正确答案,但一定是能最大程度降低不确定性的那个。这个方法来自课堂作业,发表在学术期刊,证明了好的教育能把抽象概念变成日常工具。
作者单位背景:纽约州立大学宾汉姆顿分校,Thomas J. Watson工程与应用科学学院,系统科学与工业工程系