DeepSeek可能将开源其推理引擎

banq


DeepSeek 即将开源其推理引擎,该引擎是基于 vLLM 的修改版本。现在,DeepSeek 正准备将这些修改回馈社区。

几周前,在"开源周"活动里,我们公开了几个代码库。没想到大家特别热情——很多人跑来一起帮忙改bug、提建议,讨论得热火朝天。看到这场景我们特别感动,干脆一咬牙:把自家压箱底的推理引擎也开源算了!

说真的,要不是有PyTorch、vLLM这些开源神器帮忙,我们根本搞不出现在的AI模型。就像搭积木一样,全靠社区提供的"零件"才能堆出DeepSeek这些模型。

最近越来越多人用我们的DeepSeek-V3和DeepSeek-R1模型,我们特别想回报大家。本来打算把整个推理引擎都放出来,结果发现三个头疼问题:

  1. 代码对不上号:我们的引擎是用vLLM老版本魔改的,虽然骨架差不多,但全身都整容过,别人根本用不了
  2. 拆不下来:这引擎和我们公司内部系统焊死了,要拆就得大动手术
  3. 实在忙不过来:我们研究团队人少,光搞模型就够呛,实在没精力维护大项目

所以最后想了个更靠谱的办法:我们准备和现有开源项目联手,以后主要做两件事:
  • ① 把能拆的功能单独打包,做成即插即用的小工具
  • ② 把我们的优化经验手把手教给开源社区

网友:
1、如果我理解正确的话,他们不会开源他们的推理引擎,他们将为 vllm 和 sglang 做出贡献,改进并支持 day 0 模型,因为他们的 vllm 分支太旧了。

2、我也很困惑。我看到官方仓库里写着“DeepSeek 推理引擎开源之路”,而且他们已经整理好了文件夹。但是 X 上的 vLLM 官方账号暗示它可能会合并到 vLLM 里?

3、基本上,他们定制的 vLLM 分支过于纠缠于他们的内部系统。鉴于他们无力承担维护分支的负担,他们计划发布独立模块来实现他们的定制化功能。
它带来了同样的好处,并且维护起来更轻松 - 此外,重构他们的代码也有帮助。

4、我的假设是他们的推理引擎是经过修改的 vllm。 
我并不感到惊讶。我知道很多大型互联网服务提供商只是在幕后使用 vllm,因为我曾看到错误消息通过他们的接口泄露出来。

5、我们很快就遇到了“模型就是产品”,而且该产品是免费和开源的。 
我认为 3-5 年后 LLM 将会普及。它就像数据库选择或 REST 框架一样,是一个没人会关心的基础设施。 
好消息是,这将使每个人受益。
糟糕的是,它不会给所有这些人工智能提供商的巨额估值带来好处

6、我觉得 Deepseek R1 的发布是人工智能竞赛中的一个关键时刻。虽然它不是当时最智能或最便宜的型号,但我认为人们确实注意到了 OpenAI 不再占据人工智能领域的主导地位。从那时起,我看到越来越多的人谈论 Claude、Gemini,当然还有 Deepseek 作为替代方案。我很高兴他们在开源领域不断创新。

7、人们对DeepSeek的爱类似对于维基百科的爱。