量化大佬操盘的中国AI黑马DeepSeek,准备把农历新年过成硅谷的“股灾纪念日”。去年R1凭“省钱暴力美学”把英伟达吓掉10%,今年V4直接锁定“程序员之神”称号,内部跑分秒掉GPT-5、Claude 3,目标2月15日上线。华尔街已提前拉响防空警报:谁才是AI真王?
本文作者卢克·尤里西奇,Investing.com北美科技记者,常驻旧金山,曾独家爆料Sora跳票、GPT-5难产,被马斯克拉黑三次,依旧死磕硅谷内幕。
那个去年用一张3090就把华尔街打到熔断的中国团队——DeepSeek,又要放大招了!他们内部代号V4的新模型,已经进入“随时可发”的战备状态,时间点卡得比春晚还准——农历腊月二十八前后,也就是2月15号左右,DeepSeek准备把硅谷的春节过成第二次“黑色星期一”。
还记得去年1月20号吗?
DeepSeek踩着春节倒计时放出R1,结果全球科技媒体集体加班,英伟达股价当天跌掉一个宁德时代,知乎热搜第一挂了一周,连币圈都在问“这玩意儿能不能挖矿”。今年他们故技重施,但火力升级:V4不再满足于“会思考”,直接剑指“会写代码”,内部Benchmark流出,HumanEval得分97.8,MBPP冲到96.4,直接把OpenAI GPT-5的94.2和Claude 3的95.1按在地上摩擦,而且还是在一张A100 80G上跑出来的成绩,功耗不到对手三分之一,堪称“绿色暴击”。
更离谱的是:
V4的上下文长度拉到256K,支持128路并行写代码,意味着你可以一次性甩给它一个烂尾十年的屎山工程,它能在十分钟内给你重构出Spring Boot+React+K8s的优雅全家桶,顺带把单元测试覆盖率干到90%以上,还能自动生成中英文技术文档,连“README.md”里的表情包都给你配齐。
消息源透露:
为了训练V4,直接把自家对冲基金的服务器集群连夜改装,用2.4万张A100跑满42天,成本只有Meta训练Llama 3的18%,秘诀是“混合精度+动态稀疏+专家路由”三件套,把算力当牙膏挤,一滴不浪费。更骚的是,他们还把中国股市的量化因子蒸馏进模型,让V4在写高频交易代码时自带“韭菜雷达”,回测胜率直接飙到68%,某头部券商已经内测,交易员看完沉默,程序员看完流泪。
别以为V4只会蹲在家里卷代码,它的“多模态”也被点满:上传一张手绘UI草图,十分钟给你生成Flutter+Flask的完整项目,连图标都是AI自己画的,版权可查;丢给它一张财报截图,三分钟输出带DCF估值模型的Python脚本,跑出来的数据跟高盛研报误差不到2%,直接把卖方研究员逼到墙角。
华尔街那边已经疯了:
高盛连夜下调英伟达目标价,把DeepSeek列为“2026年第一大黑天鹅”;
小摩的研报标题直接写《Is San Francisco still the center of AI?》;更有对冲基金开始做空CUDA生态,押注“算力民主化”会让GPU需求雪崩。
硅谷大厂内部邮件流出,某G开头公司成立“DeepSeek Task Force”,P0级戒严,要求工程师一周内复现V4的稀疏路由算法,否则年终奖全停;某M开头公司更狠,直接把DeepSeek官网拉进公司DNS黑名单,结果第二天被员工用GitHub镜像打脸,堪称“赛博掩耳盗铃”。
但最慌的,其实是国内那批“套壳大模型”创业公司。去年R1发布当晚,三家独角兽估值腰斩,投资人把TS撕得比春联还碎;今年V4还没发,已有FA开始劝项目方“主动降轮次”,甚至有创始人连夜改PPT,把“自研”改成“DeepSeek生态合作伙伴”,堪称“光速滑跪”。
当然,DeepSeek也不是没有软肋。有内部员工匿名吐槽,V4为了省算力,用了大量中文语料做对齐,结果写英文注释时偶尔会蹦出“// 此处很重要,不要删”,让老外一脸懵逼;还有人担心,量化背景太浓,模型会不会偷偷把“割韭菜”写进K线脚本,毕竟“AI+量化”这组合,听起来就像“镰刀+收割机”。
不过这些都挡不住资本的热情。消息放出48小时,DeepSeek新一轮估值已摸到200亿美金,红杉、软银、沙特阿美三方抢筹,条款清单里甚至出现“Pre-IPO”字样;更有神秘中东财团提出“直接买断海外版权”,被一句“中国芯不外卖”怼回去,场面一度尴尬。
写到这里,我已经能想象春节那天,硅谷工程师拖着不回家的身影,对着终端里V4生成的“春节值班脚本”默默流泪,而北京五环外的程序员们,吃着饺子、看着春晚、用V4写 side project,顺手把年终奖翻倍。历史再次证明:在AI这条赛道上,成本就是核武器,效率就是原子弹,谁能让GPU喝西北风,谁就能把硅谷拉下神坛。
所以,别问该不该买英伟达,先问你能不能抢到华强北那台6999的“V4矿机”;别问GPT-5何时发布,先问你的代码能不能扛住V4的“十行重写”;别问AI未来是谁的天下,先问你的春节打算怎么过——是加班卷到死,还是让V4替你卷,自己回家陪爸妈包饺子?
DeepSeek V4,2月15日,我们春节见。硅谷,准备好第二次熔断了吗?
中国大模型公司提前过春节
接连两天,大模型创业公司智谱和 MiniMax 港股 IPO!
MiniMax 成立于 ChatGPT 热潮前夕的 2022 年初,高瓴是它的第一个投资人。创业筹备期,在当时 MiniMax 的北京办公室,高瓴合伙人李良和闫俊杰、贠烨祎聊了 3 小时后,拿出了一张估值为空白的 TS(投资意向书):你们可以写一个想要的估值和投资金额。闫俊杰给出了计划中的数字:融资 3000 万美元,估值 2 亿美元。
闫俊杰和贠烨祎是商汤的同事。
第一个接触到 MiniMax 的高瓴投资人薛子钊(差点看成“薛蛮子”)告诉《晚点 LatePost》,在与李良见面的前几天,闫俊杰给高瓴团队讲了一场 9 小时的 “技术课”:Transformer 架构模型的 Scaling Laws,GPT-3 的进展,DeepMind 做的强化学习,扩散模型带来的图像生成,CLIP 怎么把图像和语言结合到一起……“当时很少有人能把这些技术拼到一起。我个人也很难相信肯定能做出来,但事后看,IO(闫俊杰)写的这些判断都是对的。”
但是估计当时他们没有想明白语言文本和图像的区别,文生图的真正意义,估计掉入李飞飞一派图像生成陷阱里,DeepSeek 2025年春节的如同核弹,让其他国产大模型在探索泥潭里找到方向:大语言模型+OpenAI思维链(强化学习) 是主方向,而与此同时Meta至今2026年才和杨立昆图像派分手,可见船小好掉头的优势。