最近看了Hacker News上一篇关于DeepSeek的讨论,里面有个老哥分享了他去DeepSeek总部参观的见闻。看完我的第一反应是:这公司也太佛了吧?在AI这个卷王扎堆的行业里,他们居然活得像个清流。
核心就一句话:DeepSeek把自己当成一家普通科技公司,而不是要造神的宗教。他们不搞“AI毁灭人类”那套恐慌营销,也不在乎什么奇点降临,最担心的反而是年轻人失业这种接地气的问题。这家公司只有300个员工,规模比Anthropic小一个数量级,人家还很满足,不急着扩张。
更绝的是,他们连公司牌子都不挂,说自己“没什么特别的”。这篇文章就把这些有意思的细节掰开揉碎聊一聊。
连个招牌都没有的公司,在搞什么名堂
有人去DeepSeek杭州总部拜访了。你猜怎么着?那栋12层的楼外面没有任何标识,从街上走过去根本看不出这是家AI明星公司。团队的人解释说:“这楼里很多公司呢,我们没什么特别的。”就这一句话,你跟硅谷那些恨不得把logo贴满全世界的公司对比一下,画风完全不一样。
DeepSeek是2023年成立的,创始人叫梁文锋,之前是做量化交易的。说白了就是用数学模型炒股票赚了钱,然后拿这笔钱投进AI赛道。这路子跟OpenAI那种拿着风投烧钱的玩法完全是两码事。
公司现在只有300个员工。300个人是什么概念?Anthropic的员工规模至少是他们的十倍往上。但人家不焦虑,也不急着招人扩张。管基础设施的头儿大概30岁出头,据说已经是国内顶尖的AI算力和能源专家了。整个团队都很年轻,实验室里大家都在热烈讨论,气氛挺燃的。
你看,这就是第一个有意思的对比:美国那边动不动就说AI要毁灭人类、要抢走我们的控制权,吓得一帮大佬天天喊着要监管。DeepSeek这边呢?人家最担心的是——年轻人找不到工作。这关注点也太接地气了。
年轻人用AI,中国和美国完全不是一个路子
在中国市场,大家主要用两个模型:DeepSeek和Kimi。年轻人会魔法去用Claude,但Anthropic那边设了限制,用起来挺麻烦的。人才挖角这种事跟美国一样严重,哪家公司都在抢人。
DeepSeek在圈内的口碑是“聪明又酷”,有点像美国那边Anthropic的形象。大部分AI大厂都在北京,靠近清华北大。杭州算是个例外,DeepSeek和阿里巴巴的Qwen都在那儿。
这里有个挺关键的信息:DeepSeek的人读西方的AI博客,听Dwarkesh的播客,看Gwern的文章。他们不是闭门造车,而是在吸收全世界的知识。但他们跟Anthropic的人从没碰过面。
我问你一个问题:为什么美国那边的AI公司天天把“安全”“对齐”“风险”挂在嘴边,中国这边反而没那么紧张?我觉得答案可能让人不太舒服——恐慌有时候是生意。你越是渲染AI有多危险,监管就越会倾向于你,小玩家就越难进场。
聊AI安全,他们的反应让我意外
这帮人对“AI takeover”也就是AI接管世界这种事完全不担心。你跟他们聊红队测试,他们说没做过。在中国,AI模型本身没有直接被监管,政府管的是这些模型怎么被用在软件和服务里。
换句话说,模型你可以随便训练,但你要拿来搞事情,那就有人管了。这个思路跟西方完全不同。西方是要在模型层面就给它戴上镣铐,中国是在应用层面把关。
整个中国对AI的态度是:它就是另一个技术,不是什么奇点时刻。国家的注意力还在基础设施、基本需求、给老百姓提供更多药品这些事儿上。“奇点梦想”听上去像是奢侈品,离现实还很远。
我听到这儿的时候就在想,到底谁更清醒?天天喊着AI要成神的人,和把AI当螺丝刀用的人,哪种态度更容易落地?
他们的目标和成就感,也太朴实了吧
有人问DeepSeek团队:“你们目前的高光时刻是什么?将来打算怎么退出?”他们的回答是:R1模型。就是他们已经做成的那件事,不是下一个还没发布的爆款,也不是要改变世界的宏大愿景。他们就觉得,保持比美国公司慢6个月左右的节奏挺好的,人少一点,低调一点,这样就够了。
你能想象一个OpenAI的人跟你说“我们就想跟在别人后面慢慢走”吗?不可能。那边是“要么赢要么死”的丛林法则。这边是“我们不急,慢慢来”。
DeepSeek团队提到,竞争主要来自阿里巴巴的Qwen、字节跳动和月之暗面的Kimi。说白了,这是中国本土的AI内战,不是跟美国掰手腕。
还有个细节让我觉得特别有意思:他们读Gwern的文章。Gwern是西方科技圈里一个挺另类的写手,研究方向很跨界。这说明DeepSeek的知识来源是开放的。但他们对“奇点”无感,这在西方的AI圈子里几乎是异端。
格局不同:一个想造神,一个想做事
咱们把两边摆在一起看看。
美国那边,AI公司喜欢造神。Sam Altman说过成功的创始人不是在创办公司,而是在创造类似宗教的东西。Dario Amodei天天把“建造上帝”挂在嘴边,还跑去见梵蒂冈的宗教领袖。这画风,你不觉得有点瘆人吗?
中国这边,AI就是技术。跟光伏、电池、电动车、无人机一样,是一种可以做成产业的东西。你要说中国有没有监管?有。但监管不是掐着模型本身,而是管你怎么用。
从国家层面看,中国在AI上的投入可不少。几百亿的基金砸进去,教育体系也在改革,要把AI能力普及到课堂上。但他们的目标是解决实际问题:提升生产效率、给经济找新增长点、应对就业压力。不是为了造一个超越人类智慧的“神”。
你说哪种模式更健康?我不想下结论。但我知道,宗教式的狂热容易让人走极端。把AI当锤子的人,至少在心态上更稳。
年轻人抱怨AI抢工作,他们真不是矫情
DeepSeek的人反复提到一个担忧:年轻人失业。这在中国已经是挺严重的问题了。他们不担心AI造反,担心的是AI让本就难找工作的年轻人更难了。
你看,这不就是技术伦理最朴素的样子吗?不是那些高大上的“AI对齐”“价值锁定”,就是明摆着的社会问题:如果AI能写代码、能画图、能做分析,那刚毕业的大学生怎么办?
有人可能会说,这不就跟当年工业革命时工人砸机器一样吗?有点像,但不一样。机器当时替代的是体力劳动,替代得没那么快。AI替代的是白领工作,而且速度极快。一个应届生花四年学的技能,GPT可能四个月就学会了。这落差,谁顶得住?
美国那边也不是不关心失业,但这种声音经常被“AI安全”的大话题盖过去。动不动就是“我们要防止AI毁灭人类”,那我现在房租都交不起了,谁管你AI毁不毁灭人类?
蒸馏这件事,吵来吵去有什么意思
有人酸DeepSeek,说他们不就是靠蒸馏西方模型吗?没啥真本事。
咱们先捋一下什么叫蒸馏。简单说就是用一个大模型生成的数据去训练一个小模型。很多公司都这么干,包括美国的一些大厂。
问题是,你自己训练模型用的数据是从哪儿来的?不也是从网上爬的吗?网上那些文章、代码、图片,有多少是有授权的?Meta现在还在打版权官司呢,Anthropic也刚跟作者们和解了,因为他们确实用了盗版书。你自己都没洗干净,凭什么指责别人?
再说了,就算DeepSeek用了蒸馏,他们也付了API费用的。这不是白嫖,这是合法的生意。更关键的是,DeepSeek的论文写得清清楚楚,人家有原创的东西。Flash V4出来的时候,很多开发者都说“Holy shit”,这模型真不是靠抄能抄出来的。
说中国只会抄的人,可能还活在十年前。天下文章一大抄,就看你会不会抄。现在电动车、电池、光伏、无人机,哪个不是中国领先?AI也不会是例外。
实测感受:便宜好用,谁用谁知道
很多开发者分享了他们用DeepSeek的真实体验。有人做了对比:以前每个月花200美金在某个AI上,效果还不如DeepSeek。有人算了一笔账,10美金充进去,能用一个月都不一定花得完。同样的量,换成美国那边的API,可能要30美金往上。
有个哥们说他用DeepSeek V4 Flash写代码,体验跟Claude Code差不多,甚至更好。他直接取消了ChatGPT的订阅,也取消了其他好几家。现在就留一个10美金的套餐,够用得很。
这不是个例。很多人都在说,以前觉得自己必须用“最强大”的模型,后来发现性价比才是王道。你要的是完成工作,不是追求排行榜上的虚名。
还有人提到,Fable那个200美金的套餐,接一个小项目就直接把预算烧完了。而DeepSeek那边,同样的工作量,连1美金都不到。
我知道企业采购不看单价,他们看整体方案和服务。但对个人开发者、小团队、学生来说,差价就是天壤之别。DeepSeek的存在,让AI不再是有钱人的玩具。
西方AI圈的戏,演得有点过了
回过头再看美国那边的AI叙事,你有没有觉得有点魔幻?
一边是Dario Amodei说要造“神”,一边是Sam Altman说创业者要造“宗教”。这些可不是我编的,是他们自己写的说的。
然后他们又同时跑去国会,说AI太危险了,必须监管。监管的结果是什么呢?门槛拉高,小玩家进不来,合规成本巨大,最后只有巨头玩得起。这不就是传说中的“监管捕获”吗?
说白了,用安全的名义竖起护城河,这招在任何一个行业都见过。以前是金融、是制药,现在是AI。
更搞笑的是,有人一边说自己模型强到需要藏着掖着,怕被坏人利用,一边又抱怨中国“蒸馏”他们的模型。如果你模型真那么强,为什么防不住蒸馏?如果你的安全措施真那么完善,为什么别人还能“偷”走你的能力?
这里面的逻辑漏洞,稍微想想就能看出来。
中国那边的态度反而简单:你要开源就开源,你要闭源就闭源,你要蒸馏就蒸馏。市场会说话,用户用脚投票。DeepSeek能起来,不是因为政策支持,是因为真的好用还便宜。
美国在造神,中国在做事,哪个更靠谱
咱们再拉高一点视角看。
人类历史上每一次技术革命,都伴随着两种态度。一种是技术乐观主义,觉得新技术能解决一切问题,甚至让人类进化到下一个阶段。另一种是技术实用主义,觉得工具就是工具,拿来用就好,别想太多。
AI这场革命,西方尤其是硅谷,明显偏向前者。中国偏向后者。没有绝对的对错,但结果会很不一样。
实用主义路径的优点是:落地快、成本低、大家用得起。缺点可能是:缺乏那种改变世界的“大想法”。乐观主义路径的优点是:能激发想象力,推动边界。缺点是:容易脱离实际,变成空中楼阁。
现在的问题是,AI的能力提升确实在放缓。更大模型、更多数据、更多算力,带来的边际收益在递减。这时候,谁能把现有技术用好、用便宜、用普及,谁可能就赢了。
从这一点看,DeepSeek的“小步快跑、保持低调、不追求绝对领先”策略,不一定比OpenAI的“烧钱冲AGI”策略笨。甚至可能更聪明。
技术民主化,才是真正的护城河
技术最怕什么?最怕垄断。如果最先进的AI只掌握在一两家公司手里,定价权在他们,规则由他们定,那普通用户就是案板上的肉。
现在DeepSeek、MiMo这些中国模型的存在,至少提供了一个选择。你说他们有审查?对,有。但你可以自己下载开源模型跑本地,你甚至可以自己写脚本把那些限制去掉。这在西方闭源模型上是做不到的。
更关键的是,价格战打起来,对用户永远是好事。没有DeepSeek,现在的API价格可能还是OpenAI说了算。有了DeepSeek,一个10美金的套餐就能让个人开发者完成一整月的工作量。这叫技术民主化。
也许,安安静静也许是理科生王国的特点,神神叨叨是文科生王国的特点。
总结
DeepSeek公司参访笔记深度解析,对比中美AI产业文化差异。深入探讨这家中国AI独角兽如何以300人团队、低成本、实用主义策略在竞争激烈的AI市场中突围,以及对AI安全、就业影响、模型蒸馏等热点问题的独特立场。
原文标题:Notes on DeepSeek | Hacker News
作者单位背景:本文基于Hacker News用户“vinhnx”发布的帖子及社区讨论整理分析,综合多位开发者实测反馈和AI产业观察者观点。