DeepSeek V4 Pro永久降价 AI价格打骨折

#大语言模型LLM #DeepSeek时刻 #AI基础设施 #AI投资新闻

2026-05-23 3 4K banq

DeepSeek把V4 Pro的75折临时优惠变成永久降价到原价1/4，缓存价格降到1/10，开发者疯狂迁移

DeepSeek公司把临时打折改成了永久降价

这家公司之前搞了个七五折促销活动，很多人都觉得是短期抢客户的套路。结果他们突然在官方账号发消息说，促销结束后价格不涨回去了，永久定在原价的四分之一。公告里写得很清楚，2026年5月31日下午三点多促销结束，之后就是这个便宜价了。你不用赶着在促销结束前拼命用，以后慢慢用都是这个价。对想试试但还在犹豫的人来说，这是个好消息，不怕错过优惠期了。

降价的消息在技术论坛炸了锅，短短几个小时就收到两百多个点赞和一百多条评论。大家讨论的焦点不是降不降价，而是这么便宜他们还能不能赚钱。

有人说这是不是bug价赶紧冲，有人说别急先看看缓存价格。缓存价格那个更狠，降到了原来的十分之一，而且是所有型号都降。

这意味着你问重复问题的时候，成本可以低到几乎不要钱。

降价的只有V4 Pro这一个高端型号

不是他们家所有产品都降价，只有这款叫V4 Pro的高端模型享受这个待遇。V4 Pro是他们家性能最强的型号，专门处理复杂任务比如写代码、做数学题、分析数据这些需要深度思考的活。之前价格贵，很多人想用但觉得成本太高，现在便宜了就可以考虑了。

他们家还有另一款叫V4 Flash的便宜型号，那个本来就是走低价路线的，这次价格没动。如果你平时用Flash就觉得够用了，这次降价对你影响不大。但如果你一直觉得Pro更好用就是太贵了，现在可以放心切换过去了。

有人测试过，Pro在处理特别复杂的代码任务时比Flash聪明不少，但速度慢一些。Flash更快更便宜，Pro更聪明但稍慢，现在Pro价格下来了，选择就更纠结了。

缓存价格降到了原来的十分之一

这个变化比V4 Pro降价还夸张。公告里第二条说所有型号的缓存命中价格降到了最开始发布价的十分之一。你需要先理解什么是缓存，就像你每天去同一家早餐店买豆浆，老板记住你了，你刚开口他就知道你要啥，不用重新问一遍。AI缓存也是这个道理，你问了一个问题或者类似的问题，系统把答案存起来，下次再问就直接给你，不用重新算一遍。

这个价格调整在公告发布的当天就已经生效了，比V4 Pro的降价早了一个月。对于经常做重复任务的用户来说，这个优势特别大。比如你每天让AI帮你检查同一份代码库的bug，或者反复问同一个项目的背景信息，缓存命中率会非常高。

有人分享说他们调整了工作流程，会话开始就把项目里所有文件读一遍，后面几乎所有请求都被缓存了。这样算下来每百万个输入代币的实际成本只有0.0036美元，这个数字小到几乎可以忽略。

跟别家一比价格差距太离谱了

有人把市面上主流AI模型的价格列了个单子对比。V4 Pro每百万个输出代币只要0.87美元。谷歌的Gemini 3.0 Pro要7.5美元，马斯克的Grok 3要2.5美元，智谱的GLM 4要3.08美元。更夸张的是Anthropic的Opus 4要25美元，OpenAI的GPT-5要30美元。V4 Pro的价格差不多是别人的三十分之一到四十分之一。

这意味着什么，你用V4 Pro花八毛七能干的事，用Opus或者GPT要花二十五到三十块。这就像一条街上的奶茶店，别人都卖二三十一杯，这家卖八毛七，你肯定怀疑是不是搞错了或者奶茶里掺了水。但很多开发者试过之后发现确实好用，代码能力不输给那些贵几十倍的模型。

有人专门做了测试，V4 Pro在处理复杂编码任务方面比某些贵好几倍的模型还要好。

缓存机制让实际花的钱更少了

代理工作流里面缓存读取成本占了很大一部分。什么叫代理工作流，就是你让AI帮你做事的时候，它需要反复读同样的背景信息。比如你让AI帮你改一个大型项目的代码，它每次执行任务之前都要先读一遍整个代码库的结构和内容。第一次读花了很多代币，但后面再读就直接命中缓存了。

有用户分享了一个省钱技巧，会话开始就把项目里所有文件读一遍，后面几乎所有请求都会被缓存。有人用这个办法，三周用了6500万个代币，才花了一点五美元。6500万个代币是什么概念，大概相当于把《三体》三部曲来回读好几遍的量。这要是用别家，可能几百美元就没了。

有人开玩笑说充了50美元感觉永远用不完，这放在一年前想都不敢想。

这种价格他们还能不能赚钱

很多人第一反应是怀疑他们在赔本赚吆喝，故意烧钱抢市场。但了解技术的人解释说DeepSeek的模型架构跟别家不一样。他们用的MLA注意力机制可以把键值缓存减少到原来的五分之一到十三分之一。这个技术细节有点复杂，简单说就是他们推理的时候需要的计算量比别人小得多，所以成本本来就比别人低。

另外这家公司团队规模小，没养几万人，运营成本低。他们办公室在中国电价便宜的地区，电费比美国那些数据中心便宜一大截。有用户说DeepSeek可能确实在亏本卖，但亏多少没人知道。而且很多美国AI公司也都在亏本抢市场份额，OpenAI一年亏几十亿美金。更重要的是DeepSeek没融过多少钱，不可能长期大规模烧钱，所以这个价格很可能是他们真的能做到，不是故意亏钱。

开发者已经开始大规模迁移了

很多人在论坛上说已经把Claude Code或者Codex的订阅取消了，换成了DeepSeek。有人测试了三周用了6500万个代币才花了一点五美元，这要是用别家可能几百美元就没了。还有人写了个代理脚本，可以把DeepSeek接到GitHub Copilot上用，这样在编辑器里就能直接用便宜模型了。

主流的编码代理工具基本都支持DeepSeek了。树莓派、开放代码、Zed这些大家都在用的工具，都可以直接配置DeepSeek的API密钥。有人甚至说把V4 Flash用在树莓派上配合开放代码的禅模式，直接就免费使用了。

不过也有人提醒说V4 Pro不能识别图片，如果工作需要看截图或者图表还是得切回Claude或者GPT。解决办法是用LiteLLM之类的代理工具，在不同任务之间切换模型。

本地运行也因为架构创新变得可行了

因为MLA架构大大减少了缓存占用的内存，现在在普通电脑上跑长上下文的大模型也成了可能。有人提到可以在96GB内存的苹果电脑上运行一个叫ds4-agent的工具，效果不错。虽然速度比云端慢一些，但对于注重隐私不想把代码上传到别人服务器的用户来说，本地运行不用担心数据被扫描或者保存。

有开发者正在测试在内存更小的机器上以较低性能运行。虽然加载时间会变长，但至少能跑起来了。这个趋势如果继续下去，再过两三年顶级笔记本本地推理就能达到现在云端高端模型的水平。到时候你买了新电脑就能直接在本地跑一个很强的AI，不用每个月交订阅费也不用担心数据泄露。

有人畅想说那时候AI就像现在的操作系统一样，买电脑就自带，不用额外花钱。

唯一的槽点是千万别聊政治

有用户反映说千万别跟DeepSeek聊政治话题，不然会触发审查规则。模型会思考一会儿，然后突然把所有内容清空，建议你换个话题但不解释原因。还有人遇到过输出一些关于新闻媒体如何为人民服务的通用套话，让人感觉很莫名其妙。两次都让用户很意外，因为他并没有提出任何敏感或者非法的问题，只是话题稍微沾了点政治边。

不过也有人觉得这反而让人放心。至少说明他们是有明确审查机制的，不是偷偷摸摸收集你的数据然后不知道拿去干什么用。有人对比说西方的审查更隐蔽，你可能被过滤了都不知道。对于纯粹的技术工作比如写代码、修bug、做数据分析来说，这个问题基本不影响使用。

你也可以选择通过第三方服务商比如Microsoft Azure或者Deepinfra来用DeepSeek，这样数据保留政策可能更符合企业要求。

这对整个AI行业意味着什么

价格战打到这个地步，其他公司很难跟。有人拿这个价格对比当年中国电动车和美国电动车的竞争，说历史正在重演。美国公司研发成本高团队臃肿，还要给投资人交代，很难把价格压到这么低。而DeepSeek靠架构创新和运营效率，把成本降到了不可思议的程度。有人感叹说这才是真正的创新，不是靠堆钱堆人，而是靠聪明的设计。

有人预测美国政府可能会像对付华为一样，限制DeepSeek进入美国市场。但在那之前，全球开发者已经可以用上这个便宜到离谱的AI模型了。

对于个人开发者和小团队来说，这意味着可以随便用AI而不用担心月底账单爆炸。有人充了50美元感觉永远用不完，这放在一年前想都不敢想。那时候用高端模型做一个项目可能就要花好几百美元，现在同样的钱可以用几百倍甚至几千倍的量。