Mistral AI发布Devstral Small 1.1本地开源模型


今天,我们推出 Devstral Medium 模型,以及 Devstral Small 的升级版。这些模型由 Mistral AI 和All Hands AI合作发布,重点强调对不同提示和代理支架的泛化能力。 

全新 Devstral Small 1.1 采用 Apache 2.0 许可证发布,是代码代理开放模型中最先进的。Devstral Medium 可通过我们的 API 获取,并在性价比帕累托前沿上创下新高,以四分之一的价格超越了 Gemini 2.5 Pro 和 GPT 4.1。

Devstral Small 1.1
与 Devstral Small 的上一版本一样,我们根据 Apache 2.0 许可证发布了 Devstral Small 1.1。虽然架构保持不变,参数数量仅有 24B,但 Devstral Small 1.1 与其前身相比有了显著的改进:

1、增强性能
Devstral Small 1.1 在 SWE-Bench Verified 上获得了 53.6% 的分数,并为没有测试时间扩展的开放模型设定了新的最先进水平。

2、多功能性和通用性
Devstral Small 1.1 与 OpenHands 配合使用时表现出色,并且能够更好地泛化到不同的提示符和编码环境。它同时支持 Mistral 函数调用和 XML 格式,进一步增强了其多功能性,使其能够适用于各种应用程序和代理框架。

Devstral Medium
Devstral Medium 继承了 Devstral Small 的优势,并将性能提升至更高水平,在 SWE-Bench Verified 测试中获得了 61.6% 的得分。Devstral Medium 可通过我们的公共 API 获取,其卓越的性能和极具竞争力的价格使其成为寻求高质量、高性价比模型的企业和开发者的理想之选。

对于偏好本地解决方案的用户,Devstral Medium 可以直接部署在私有基础设施上,从而增强数据隐私和控制力。我们还支持 Devstral Medium 的自定义微调,允许企业根据特定用例定制模型,并根据其特定需求实现最佳性能。 

可用性 
两种模型均可通过我们的 API 使用以下名称: 

  • devstral-small-2507 的价格与 Mistral Small 3.1 相同:0.1 美元/M 输入代币和 0.3 美元/M 输出代币。 
  • devstral-medium-2507 的价格与 Mistral Medium 3 相同:0.4 美元/百万输入代币和 2 美元/百万输出代币。 
我们根据 Apache 2.0 许可证发布了 Devstral Small 1.1,供社区构建、定制和加速自主软件开发。如果您想亲自尝试,请访问我们的模型卡。 

Devstral Small 易于本地部署,并遵循 Apache 2.0 许可证,可供所有人使用和构建;而 Devstral Medium 则可通过我们的 API 获取,并为开发者和企业提供高性能。 



极客辣评:


Devstral 和 Codestral 有啥不一样?
它们都是两个编程小助手,功能都是帮你写代码的,但脾气秉性可大不一样!

* Codestral:这哥们儿是个“行动派”!
你跟它说“嘿,帮我写个函数,实现那个功能!”它立马就会说:“没问题!代码拿去,自己看,自己搞定!”

它就像个脾气有点急、做事特别麻利的小伙伴,你刚把需求说完,它“嗖”地一下就把代码甩给你了,简单粗暴,效率是挺高,但你得自己花点时间去理解它给的代码,看看它是不是完全符合你的心意。它比较适合那种你心里已经有个大致想法,就差个敲代码的苦力活的时候。就像你有个模型,它帮你把模型搭好了,你直接用就行。

以前那些像 Copilot 或者 aider 这种,你给个提示,它直接蹦出一段代码的工具,用的就是 Codestral 这种风格。它只负责“给代码”,不负责“思考过程”。

* Devstral:这哥们儿是个“思考型选手”!
你跟它说“我想实现一个功能,需要这么几个步骤……”它会一边听一边点头:“嗯嗯,我明白了。那这样,我先去读一下这个文件,然后我再读一下那个文件,接下来我就可以修改这里,最后我再把修改好的内容保存起来。”

它就像一个特别有条理、特别“聪明”的小伙伴,你给它一个任务,它不会直接给你结果,而是会一步一步地跟你“汇报”它的思考过程:“老板,我准备这么做:
第一步,我要先去了解一下背景资料(read\_files);
第二步,我要去分析一下现有数据(又read\_files);
第三步,我开始动手改(edit that);
第四步,我把成果整理好交给你(write\_files)。”
它会把任务拆解成一个个小步骤,每一步都告诉你它在干嘛,就像一个有计划的“小特工”,特别适合那些需要复杂操作、需要它帮你“想办法”的任务。

咱们现在说的“Agentic智能体”或者“Tool Use工具使用”就是指这种能自己规划、自己使用工具的能力。Devstral 就是专门为此训练的,它更像一个“有智慧”的助手。



那么,哪个跟 VS Code + Cline 配合得更好呢?

答案非常肯定:Devstral,它绝对是首选!

* 为啥是 Devstral 呢?
   
你想啊,VS Code + Cline 这种组合,我们往往希望它能帮我们做更复杂、更“智能”的操作。比如,你可能想让它帮你“找到代码里的一个 bug,然后自动修复它”,或者“分析一下我整个项目的结构,然后给我一些优化建议”。

    * 这时候 Devstral 的优势就体现出来了! 它能理解你的“高级指令”,然后自己去规划执行步骤:
        1.  “哦,你要找 bug 啊?那我先去读一下你的错误日志文件。”
        2.  “嗯,读完了。然后我再去看看你最近修改过的代码文件。”
        3.  “找到可疑的地方了!现在我来尝试修改它。”
        4.  “改好了!我再把修改后的文件保存一下,然后跑个测试看看。”
    * 它这种“有规划、有步骤、能跟工具互动”的能力,简直就是为 VS Code + Cline 这种场景量身定制的!它不再是简单地给你一段代码让你自己消化,而是能像一个真正的“智能程序员”一样,帮你分析问题、解决问题,甚至还能“主动”地去调用一些工具(比如读取文件、写入文件、运行测试等等)。

* Codestral 就不太行了吗?
   
 也不是说它完全不行,只是没那么适合。Codestral 更像是你敲一行注释,它给你补全一行代码;或者你问它一个简单的问题,它直接给你答案。它缺乏Devstral那种“大局观”和“执行力”。

     如果你只是用 VS Code + Cline 做一些简单的代码补全或者快速生成代码片段,Codestr al 也能应付。但如果你想让它做一些更深入、更“像人一样思考”的工作,Devstral 才是你的不二之选。



总结一下就是:

* Codestral:快准狠,代码甩给你,自己搞定! 适合简单、直接的代码生成。
* Devstral:有思想,有计划,一步步帮你解决问题! 适合复杂、需要思考和工具协作的任务。

所以,在 VS Code + Cline 这种追求“智能协作”的环境下,Devstral 绝对是更强大的那个!它能真正成为你的“得力助手”,帮你处理那些需要动脑筋的活儿。