今天,我们推出 Devstral Medium 模型,以及 Devstral Small 的升级版。这些模型由 Mistral AI 和All Hands AI合作发布,重点强调对不同提示和代理支架的泛化能力。
全新 Devstral Small 1.1 采用 Apache 2.0 许可证发布,是代码代理开放模型中最先进的。Devstral Medium 可通过我们的 API 获取,并在性价比帕累托前沿上创下新高,以四分之一的价格超越了 Gemini 2.5 Pro 和 GPT 4.1。
Devstral Small 1.1
与 Devstral Small 的上一版本一样,我们根据 Apache 2.0 许可证发布了 Devstral Small 1.1。虽然架构保持不变,参数数量仅有 24B,但 Devstral Small 1.1 与其前身相比有了显著的改进:
1、增强性能
Devstral Small 1.1 在 SWE-Bench Verified 上获得了 53.6% 的分数,并为没有测试时间扩展的开放模型设定了新的最先进水平。
2、多功能性和通用性
Devstral Small 1.1 与 OpenHands 配合使用时表现出色,并且能够更好地泛化到不同的提示符和编码环境。它同时支持 Mistral 函数调用和 XML 格式,进一步增强了其多功能性,使其能够适用于各种应用程序和代理框架。
Devstral Medium
Devstral Medium 继承了 Devstral Small 的优势,并将性能提升至更高水平,在 SWE-Bench Verified 测试中获得了 61.6% 的得分。Devstral Medium 可通过我们的公共 API 获取,其卓越的性能和极具竞争力的价格使其成为寻求高质量、高性价比模型的企业和开发者的理想之选。
对于偏好本地解决方案的用户,Devstral Medium 可以直接部署在私有基础设施上,从而增强数据隐私和控制力。我们还支持 Devstral Medium 的自定义微调,允许企业根据特定用例定制模型,并根据其特定需求实现最佳性能。
可用性
两种模型均可通过我们的 API 使用以下名称:
- devstral-small-2507 的价格与 Mistral Small 3.1 相同:0.1 美元/M 输入代币和 0.3 美元/M 输出代币。
- devstral-medium-2507 的价格与 Mistral Medium 3 相同:0.4 美元/百万输入代币和 2 美元/百万输出代币。
Devstral Small 易于本地部署,并遵循 Apache 2.0 许可证,可供所有人使用和构建;而 Devstral Medium 则可通过我们的 API 获取,并为开发者和企业提供高性能。
极客辣评:
Devstral 和 Codestral 有啥不一样?
它们都是两个编程小助手,功能都是帮你写代码的,但脾气秉性可大不一样!
* Codestral:这哥们儿是个“行动派”!
你跟它说“嘿,帮我写个函数,实现那个功能!”它立马就会说:“没问题!代码拿去,自己看,自己搞定!”
它就像个脾气有点急、做事特别麻利的小伙伴,你刚把需求说完,它“嗖”地一下就把代码甩给你了,简单粗暴,效率是挺高,但你得自己花点时间去理解它给的代码,看看它是不是完全符合你的心意。它比较适合那种你心里已经有个大致想法,就差个敲代码的苦力活的时候。就像你有个模型,它帮你把模型搭好了,你直接用就行。
以前那些像 Copilot 或者 aider 这种,你给个提示,它直接蹦出一段代码的工具,用的就是 Codestral 这种风格。它只负责“给代码”,不负责“思考过程”。
* Devstral:这哥们儿是个“思考型选手”!
你跟它说“我想实现一个功能,需要这么几个步骤……”它会一边听一边点头:“嗯嗯,我明白了。那这样,我先去读一下这个文件,然后我再读一下那个文件,接下来我就可以修改这里,最后我再把修改好的内容保存起来。”
它就像一个特别有条理、特别“聪明”的小伙伴,你给它一个任务,它不会直接给你结果,而是会一步一步地跟你“汇报”它的思考过程:“老板,我准备这么做:
第一步,我要先去了解一下背景资料(read\_files);
第二步,我要去分析一下现有数据(又read\_files);
第三步,我开始动手改(edit that);
第四步,我把成果整理好交给你(write\_files)。”
它会把任务拆解成一个个小步骤,每一步都告诉你它在干嘛,就像一个有计划的“小特工”,特别适合那些需要复杂操作、需要它帮你“想办法”的任务。
咱们现在说的“Agentic智能体”或者“Tool Use工具使用”就是指这种能自己规划、自己使用工具的能力。Devstral 就是专门为此训练的,它更像一个“有智慧”的助手。
那么,哪个跟 VS Code + Cline 配合得更好呢?
答案非常肯定:Devstral,它绝对是首选!
* 为啥是 Devstral 呢?
你想啊,VS Code + Cline 这种组合,我们往往希望它能帮我们做更复杂、更“智能”的操作。比如,你可能想让它帮你“找到代码里的一个 bug,然后自动修复它”,或者“分析一下我整个项目的结构,然后给我一些优化建议”。
* 这时候 Devstral 的优势就体现出来了! 它能理解你的“高级指令”,然后自己去规划执行步骤:
1. “哦,你要找 bug 啊?那我先去读一下你的错误日志文件。”
2. “嗯,读完了。然后我再去看看你最近修改过的代码文件。”
3. “找到可疑的地方了!现在我来尝试修改它。”
4. “改好了!我再把修改后的文件保存一下,然后跑个测试看看。”
* 它这种“有规划、有步骤、能跟工具互动”的能力,简直就是为 VS Code + Cline 这种场景量身定制的!它不再是简单地给你一段代码让你自己消化,而是能像一个真正的“智能程序员”一样,帮你分析问题、解决问题,甚至还能“主动”地去调用一些工具(比如读取文件、写入文件、运行测试等等)。
* Codestral 就不太行了吗?
也不是说它完全不行,只是没那么适合。Codestral 更像是你敲一行注释,它给你补全一行代码;或者你问它一个简单的问题,它直接给你答案。它缺乏Devstral那种“大局观”和“执行力”。
如果你只是用 VS Code + Cline 做一些简单的代码补全或者快速生成代码片段,Codestr al 也能应付。但如果你想让它做一些更深入、更“像人一样思考”的工作,Devstral 才是你的不二之选。
总结一下就是:
* Codestral:快准狠,代码甩给你,自己搞定! 适合简单、直接的代码生成。
* Devstral:有思想,有计划,一步步帮你解决问题! 适合复杂、需要思考和工具协作的任务。
所以,在 VS Code + Cline 这种追求“智能协作”的环境下,Devstral 绝对是更强大的那个!它能真正成为你的“得力助手”,帮你处理那些需要动脑筋的活儿。