AI基础设施、芯片和机器人

五张专业显卡加5090跑GLM5.2，80万AI炼狱之旅血泪史

#AI基础设施 #本地小语言模型 #DeepSeek时刻

2026-07-04 4K banq

千万别学他！花80万组AI怪兽，回本要十年

烧钱跑AI模型，这哥们花80万给自己造了个“电暖器”

这哥们本来只想搞个双显卡跑跑小模型，结果一路失控，最后在家里整出了个价值80万人民币、五张专业显卡加一张游戏卡皇的AI怪兽。更搞笑的是，他最后发现这玩意儿回本需要十年，热得能当电暖器用，而唯一的出路是删掉电力公司的APP假装自己没交电费。

他的故事从一个不切实际的幻想开始

这哥们一开始觉得，自己游戏电脑上那张5090显卡挺不错。这张卡在游戏圈已经是顶级货了，玩什么游戏都绰绰有余。

但他心里有个小声音在说，要是再来一张5090，组个双卡系统，那跑AI模型肯定飞起。于是他真的动手了。

结果发现，两张5090插在主板上，看起来很美，但跑起稍微大点的模型，就像让两个人挤在一辆独轮车上，根本施展不开。他这才意识到，事情没那么简单。

主板成了他烧钱的第一张多米诺骨牌

他琢磨着，要想让两张甚至更多显卡都跑满速，必须得有个顶级主板。普通主板插满显卡后速度会下降，就像高速公路突然变窄。

他直接上了工作站级别的WRX90主板，配合顶级的线程撕裂者Pro处理器。这块主板和CPU的组合，价格已经够买一台不错的二手汽车了。

但主板买回来只是个开始。他发现新主板和原来的机箱不配套，老机箱根本装不下这块大家伙。这就像买了个超大号冰箱，结果发现厨房门太窄。

机箱成了他第一个砸手里的废铁

他千挑万选，买了个号称顶级设计的Antec 900机箱。这机箱大得像个小衣柜，外观也很唬人，价格当然也不便宜。

但装进去他才发现，这么贵的机箱，显卡固定支架竟然做得稀烂。五斤多重的显卡插上去，晃晃悠悠的，感觉随时会把主板压断。

他自己动手用支架加固，但心里那个气啊。他说这就好比花大钱买了辆法拉利，结果发现车里没装汽油，还得自己拿矿泉水瓶去加油站打油。最后他把这机箱直接扔了。

两张5090跑模型就像让博尔特跑马拉松

硬件折腾完，他开始试跑模型。两张5090加起来的显存虽然不小，但面对真正的大模型，还是捉襟见肘。

他跑的是当时比较流行的Qwen系列模型。这个系列模型能力不错，但对于他想搞的复杂任务，比如带视觉识别（VL）的多模态应用，就像让小学生去解微积分。

模型本身不够聪明，显存又经常爆满。他感觉自己在用一个很贵的计算器，而不是智能电脑。每次运行都小心翼翼，生怕显存不够程序崩溃。

他加了一张专业卡，发现模型变聪明也变傻了

终于，他没忍住，买了一张专业显卡RTX Pro 6000。这卡一张的价格就顶好几张5090，但显存大得惊人。

他把一张Pro 6000和一张5090混着用。llama.cpp这个开源软件很智能，能自动把模型拆开，让两张不同型号的显卡一起算。这叫张量并行，听着很高级。

模型确实能跑更大的了，参数到了120B级别，智商明显提升。但新问题来了，大模型虽然聪明，但记性特别差，上下文窗口稍微长点就忘了前面聊啥。他说这模型像个有学问但只有七秒记忆的金鱼。

两张专业卡加一张游戏卡，他终于不满足

他又加了一张Pro 6000，组成两专一游的组合。这下总算有足够显存放得下大模型和长对话历史了。但跑出来的效果却让他大失所望。

从之前的小模型升级到大模型，感觉就像把学习成绩从90分提高到95分。看似进步了，但那最后的5%才是最要命的。

他发现95分和90分在实际干活时根本没区别，因为都完不成任务。模型输出的代码经常有bug，逻辑也不严谨，最后还得他自己熬夜重写。这钱感觉白花了。

四张专业卡让他家里变成了桑拿房

一咬牙，他又买了第四张Pro 6000。四张卡插在主板上，像四块砖头紧紧挨着，中间几乎没有缝隙。这配置跑MiniMax这类巨型模型终于顺畅了点，他开始感觉自己的需求被满足了。

但代价是巨大的。四张卡同时满负荷运转，发热量惊人。他在机箱旁边加了好几个暴力风扇，甚至把家里一个27寸的大风扇拆下来对着吹，还是不行。

系统动不动就过热死机，屏幕一黑，他几个小时的工作就全没了。他尝试降低显卡频率和电压来减少发热，但性能又下降了，问题回到了原点。

开放式机架让他放弃了美观也放弃了理智

为了散热，他放弃了传统机箱，买了那种完全敞开、像架子一样的开放式测试平台。他想给每张显卡都安排自己的独立楼层，互不干扰。

结果发现，用延长线把显卡分开连接，线材乱得像蜘蛛网，散热问题也没根本解决，只是从显卡自身发热变成了整间屋子发热。这套方案他又放弃了，纯属瞎折腾。

他感觉自己陷入了一个怪圈，每次升级都为了解决上个问题，结果又带来新的、更棘手的问题。钱包在流血，问题在膨胀。

五张专业卡加一张5090，他终于跑起了GLM5.2

最后，他彻底放飞了。五张Pro 6000加上原来的5090，六张顶级显卡组成了一个庞然大物。他终于能流畅运行当时最强的开源模型之一，GLM 5.2。

这一次，效果确实不一样了。他说模型的完成度达到了98%到99%，代码基本拿来就能用，逻辑也缜密了许多。他感觉自己终于熬出头了。

但这个六卡怪兽在全速运转时，功率高得吓人，需要一个额外的独立电源才能带动。而且发热量已经到了可以改变房间温度的程度。当时正好是夏天，他家地下室开着空调都像烤炉。

他为了供电删掉了电力公司APP

为了支撑这套系统，他专门拉了一条独立电路，换了更大功率的电源。计算了一下电费，如果24小时开机，每个月的电费都够付一辆车的月供了。

他觉得最讽刺的是，花了这么多钱和精力搞硬件，回本周期算下来要超过十年。这还没算电费，按今天AI服务的价格，他生成一亿个token才能勉强回本。

在心态崩了之后，他做了个很经典的决定：把电力公司的手机应用删了。他调侃说，只要我看不到账单，账单就不存在。这是自欺欺人的最高境界。

他的故事告诉我们几个残酷的道理

第一，算力这玩意儿，总有办法让你花掉最后一分钱。你以为两张5090是终点，结果发现那只是起点。对显存的渴望是永无止境的深渊。

第二，硬件升级的快乐和痛苦是成正比的。每解决一个问题，系统就会变得更复杂，引出三个新问题。机箱、散热、电源、空间，每个环节都成了瓶颈。

第三，最好的省钱方式就是认清自己的需求。他最后也承认，花这么多钱组这个大家伙，还不如直接用云服务商的顶级付费模型。至少人家还帮你管散热和电费。

作为一个顶级内容策略师和认知分析师，我能清晰地看到这场烧钱远征背后的语言游戏。这不仅仅是硬件评测，这是现代消费主义和技术狂热交织下的认知失调活教材。

这位老哥用真金白银和地下室飙升的温度，生动诠释了什么叫“边际效用递减”。从90分到95分，再到99分，每一分的提升都在成倍消耗你的资源、耐心和理智。

他自嘲这是个糟糕透顶的主意，劝大家千万别学。但相信我，这帖子本身就会激发下一批勇士前赴后继，去买下个月新出的显卡。因为人类对“掌控感”和“本地私有”的执念，永远比单纯算经济账要强烈得多。

所以，下次当你看着购物车里的顶级显卡流口水时，不妨想想这个在地下室与六块发热砖头和删掉的电力公司APP作斗争的男人。然后问问自己：我到底是为AI冲动，还是为冲动付电费？

作： Reddit用户yeah_likerage，AI硬件发烧友社区成员