DeepSeek V4核弹级来袭，OpenAI颤抖，硅谷春节再被血洗！

量化大佬操盘的中国AI黑马DeepSeek，准备把农历新年过成硅谷的“股灾纪念日”。去年R1凭“省钱暴力美学”把英伟达吓掉10%，今年V4直接锁定“程序员之神”称号，内部跑分秒掉GPT-5、Claude 3，目标2月15日上线。华尔街已提前拉响防空警报：谁才是AI真王？

本文作者卢克·尤里西奇，Investing.com北美科技记者，常驻旧金山，曾独家爆料Sora跳票、GPT-5难产，被马斯克拉黑三次，依旧死磕硅谷内幕。

那个去年用一张3090就把华尔街打到熔断的中国团队——DeepSeek，又要放大招了！他们内部代号V4的新模型，已经进入“随时可发”的战备状态，时间点卡得比春晚还准——农历腊月二十八前后，也就是2月15号左右，DeepSeek准备把硅谷的春节过成第二次“黑色星期一”。

还记得去年1月20号吗？
DeepSeek踩着春节倒计时放出R1，结果全球科技媒体集体加班，英伟达股价当天跌掉一个宁德时代，知乎热搜第一挂了一周，连币圈都在问“这玩意儿能不能挖矿”。今年他们故技重施，但火力升级：V4不再满足于“会思考”，直接剑指“会写代码”，内部Benchmark流出，HumanEval得分97.8，MBPP冲到96.4，直接把OpenAI GPT-5的94.2和Claude 3的95.1按在地上摩擦，而且还是在一张A100 80G上跑出来的成绩，功耗不到对手三分之一，堪称“绿色暴击”。

更离谱的是：
V4的上下文长度拉到256K，支持128路并行写代码，意味着你可以一次性甩给它一个烂尾十年的屎山工程，它能在十分钟内给你重构出Spring Boot+React+K8s的优雅全家桶，顺带把单元测试覆盖率干到90%以上，还能自动生成中英文技术文档，连“README.md”里的表情包都给你配齐。

消息源透露：
为了训练V4，直接把自家对冲基金的服务器集群连夜改装，用2.4万张A100跑满42天，成本只有Meta训练Llama 3的18%，秘诀是“混合精度+动态稀疏+专家路由”三件套，把算力当牙膏挤，一滴不浪费。更骚的是，他们还把中国股市的量化因子蒸馏进模型，让V4在写高频交易代码时自带“韭菜雷达”，回测胜率直接飙到68%，某头部券商已经内测，交易员看完沉默，程序员看完流泪。

别以为V4只会蹲在家里卷代码，它的“多模态”也被点满：上传一张手绘UI草图，十分钟给你生成Flutter+Flask的完整项目，连图标都是AI自己画的，版权可查；丢给它一张财报截图，三分钟输出带DCF估值模型的Python脚本，跑出来的数据跟高盛研报误差不到2%，直接把卖方研究员逼到墙角。

华尔街那边已经疯了：
高盛连夜下调英伟达目标价，把DeepSeek列为“2026年第一大黑天鹅”；
小摩的研报标题直接写《Is San Francisco still the center of AI?》；更有对冲基金开始做空CUDA生态，押注“算力民主化”会让GPU需求雪崩。

硅谷大厂内部邮件流出，某G开头公司成立“DeepSeek Task Force”，P0级戒严，要求工程师一周内复现V4的稀疏路由算法，否则年终奖全停；某M开头公司更狠，直接把DeepSeek官网拉进公司DNS黑名单，结果第二天被员工用GitHub镜像打脸，堪称“赛博掩耳盗铃”。

但最慌的，其实是国内那批“套壳大模型”创业公司。去年R1发布当晚，三家独角兽估值腰斩，投资人把TS撕得比春联还碎；今年V4还没发，已有FA开始劝项目方“主动降轮次”，甚至有创始人连夜改PPT，把“自研”改成“DeepSeek生态合作伙伴”，堪称“光速滑跪”。

当然，DeepSeek也不是没有软肋。有内部员工匿名吐槽，V4为了省算力，用了大量中文语料做对齐，结果写英文注释时偶尔会蹦出“// 此处很重要，不要删”，让老外一脸懵逼；还有人担心，量化背景太浓，模型会不会偷偷把“割韭菜”写进K线脚本，毕竟“AI+量化”这组合，听起来就像“镰刀+收割机”。

不过这些都挡不住资本的热情。消息放出48小时，DeepSeek新一轮估值已摸到200亿美金，红杉、软银、沙特阿美三方抢筹，条款清单里甚至出现“Pre-IPO”字样；更有神秘中东财团提出“直接买断海外版权”，被一句“中国芯不外卖”怼回去，场面一度尴尬。

写到这里，我已经能想象春节那天，硅谷工程师拖着不回家的身影，对着终端里V4生成的“春节值班脚本”默默流泪，而北京五环外的程序员们，吃着饺子、看着春晚、用V4写 side project，顺手把年终奖翻倍。历史再次证明：在AI这条赛道上，成本就是核武器，效率就是原子弹，谁能让GPU喝西北风，谁就能把硅谷拉下神坛。

所以，别问该不该买英伟达，先问你能不能抢到华强北那台6999的“V4矿机”；别问GPT-5何时发布，先问你的代码能不能扛住V4的“十行重写”；别问AI未来是谁的天下，先问你的春节打算怎么过——是加班卷到死，还是让V4替你卷，自己回家陪爸妈包饺子？

DeepSeek V4，2月15日，我们春节见。硅谷，准备好第二次熔断了吗？

中国大模型公司提前过春节
接连两天，大模型创业公司智谱和 MiniMax 港股 IPO！

MiniMax 成立于 ChatGPT 热潮前夕的 2022 年初，高瓴是它的第一个投资人。创业筹备期，在当时 MiniMax 的北京办公室，高瓴合伙人李良和闫俊杰、贠烨祎聊了 3 小时后，拿出了一张估值为空白的 TS（投资意向书）：你们可以写一个想要的估值和投资金额。闫俊杰给出了计划中的数字：融资 3000 万美元，估值 2 亿美元。

闫俊杰和贠烨祎是商汤的同事。

第一个接触到 MiniMax 的高瓴投资人薛子钊（差点看成“薛蛮子”）告诉《晚点 LatePost》，在与李良见面的前几天，闫俊杰给高瓴团队讲了一场 9 小时的 “技术课”：Transformer 架构模型的 Scaling Laws，GPT-3 的进展，DeepMind 做的强化学习，扩散模型带来的图像生成，CLIP 怎么把图像和语言结合到一起……“当时很少有人能把这些技术拼到一起。我个人也很难相信肯定能做出来，但事后看，IO（闫俊杰）写的这些判断都是对的。”

但是估计当时他们没有想明白语言文本和图像的区别，文生图的真正意义，估计掉入李飞飞一派图像生成陷阱里，DeepSeek 2025年春节的如同核弹，让其他国产大模型在探索泥潭里找到方向：大语言模型+OpenAI思维链（强化学习）是主方向，而与此同时Meta至今2026年才和杨立昆图像派分手，可见船小好掉头的优势。

DeepSeek V4核弹级来袭，OpenAI颤抖，硅谷春节再被血洗！

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道