Ministral 8B：比Mistral 7B LLM 更强大

#大语言模型LLM

2024-10-17 banq

Mistral AI 推出 Ministral 8B，这是其广受欢迎的 Mistral 7B LLM 的更强大的继任者。8B 级 Ministral 总体成绩最好，尤其是在知识、常识和多语言技能方面。

法国人工智能初创公司 Mistral AI 宣布了两种专为边缘设备和边缘计算场景使用而设计的新语言模型。
这两款新型号名为Ministral 3B 和 Ministral 8B，属于“Ministraux”系列。据 Mistral 称，它们是目前同类产品中针对边缘用例最强大的 AI 系统。两种型号都支持高达 128,000 个标记的上下文长度。

应用范围从翻译到机器人
Ministraux 模型专为本地处理和隐私至关重要的用例而设计。Mistral 表示，它们非常适合设备上翻译、离线智能助手、本地数据分析和自主机器人等任务。

该公司表示，当与Mistral Large等更大的语言模型相结合时，Ministraux 还可以充当多步骤工作流中函数调用的有效中介。

性能：
8B 级 Ministral 总体成绩最好，尤其是在知识、常识和多语言技能方面。

Mistral 提供的基准测试表明，Ministral 3B 和 8B 在大多数类别中的表现都优于谷歌的 Gemma 2 2B和Meta 的 Llama 3.1 8B等同类机型。该公司重点介绍了尺寸较小的 Ministral 3B 的性能，它在某些基准测试中超越了尺寸较大的前身Mistral 7B。Mistral 7B 被广泛认为是最成功的开源机型之一。

规模更大的 Ministral 8B 在所有基准测试中的表现都明显优于 7B 模型。Mistral AI 报告称，Ministral 8B 在知识、常识、函数调用和多语言能力等领域表现尤为出色。它没有将其与较新的Llama 3.2 11B进行比较，后者可能略胜一筹（MMLU 为 73），但不在 100 亿参数类别中。

总结

法国人工智能公司 Mistral AI 推出了两种新的语言模型，分别称为 Ministral 3B 和 8B。这些模型专门针对边缘设备和边缘计算场景进行了优化，支持高达 128,000 个标记的上下文长度。
据该公司介绍，这些“Ministraux”模型特别适合本地处理和隐私至关重要的应用，例如设备上翻译、离线智能助手、本地数据分析和自主机器人。
Mistral 提供的基准测试表明，Ministral 3B 和 8B 在许多类别中的表现都优于同类模型。新模型现在可通过 API 获得，价格从每百万代币 0.04 美元到 0.10 美元不等。出于研究目的，Mistral AI 还提供了 Ministral 8B Instruct 的模型权重。