Ministral 8B:比Mistral 7B LLM 更强大

Mistral AI 推出 Ministral 8B,这是其广受欢迎的 Mistral 7B LLM 的更强大的继任者。8B 级 Ministral 总体成绩最好,尤其是在知识、常识和多语言技能方面。

法国人工智能初创公司 Mistral AI 宣布了两种专为边缘设备和边缘计算场景使用而设计的新语言模型。
这两款新型号名为Ministral 3B 和 Ministral 8B,属于“Ministraux”系列。据 Mistral 称,它们是目前同类产品中针对边缘用例最强大的 AI 系统。两种型号都支持高达 128,000 个标记的上下文长度。

应用范围从翻译到机器人
Ministraux 模型专为本地处理和隐私至关重要的用例而设计。Mistral 表示,它们非常适合设备上翻译、离线智能助手、本地数据分析和自主机器人等任务。

该公司表示,当与Mistral Large等更大的语言模型相结合时,Ministraux 还可以充当多步骤工作流中函数调用的有效中介。

性能:
8B 级 Ministral 总体成绩最好,尤其是在知识、常识和多语言技能方面。

Mistral 提供的基准测试表明,Ministral 3B 和 8B 在大多数类别中的表现都优于谷歌的 Gemma 2 2BMeta 的 Llama 3.1 8B等同类机型。该公司重点介绍了尺寸较小的 Ministral 3B 的性能,它在某些基准测试中超越了尺寸较大的前身Mistral 7B。Mistral 7B 被广泛认为是最成功的开源机型之一。

规模更大的 Ministral 8B 在所有基准测试中的表现都明显优于 7B 模型。Mistral AI 报告称,Ministral 8B 在知识、常识、函数调用和多语言能力等领域表现尤为出色。它没有将其与较新的Llama 3.2 11B进行比较,后者可能略胜一筹(MMLU 为 73),但不在 100 亿参数类别中。

总结

  • 法国人工智能公司 Mistral AI 推出了两种新的语言模型,分别称为 Ministral 3B 和 8B。这些模型专门针对边缘设备和边缘计算场景进行了优化,支持高达 128,000 个标记的上下文长度。
  • 据该公司介绍,这些“Ministraux”模型特别适合本地处理和隐私至关重要的应用,例如设备上翻译、离线智能助手、本地数据分析和自主机器人。
  • Mistral 提供的基准测试表明,Ministral 3B 和 8B 在许多类别中的表现都优于同类模型。新模型现在可通过 API 获得,价格从每百万代币 0.04 美元到 0.10 美元不等。出于研究目的,Mistral AI 还提供了 Ministral 8B Instruct 的模型权重。