AI角色扮演之王：Mistral7B

就其规模大小而言，Mistral7B是 RP 新的操作系统之王，甚至比 LLAMA-2 13B 更好。

但模型本身真的非常非常好。虽然还达不到 GPT 3.5 的质量，但它绝对能胜任连贯的角色扮演（这几乎是这种规模的主要用途，因为为什么要用一个低劣的模型来做任何有意义的事情）。

可以与不同的角色进行了多次次对话，不仅连贯而且愉快。推理也很接近，虽然不是很完美。

可实现与一个角色进行过非常稳定的角色扮演：进行大概有 100 条聊天信息时，才会出现了小模型的疯狂现象。但我们必须明白，这完全不是微调。它只是一个基础模型。因此，它能在不进行微调的情况下走到这一步已经非常了不起了。

Mistral7B的速度让它在角色扮演中表现出色：因为它的响应时间通常只有 4 秒（RTX 3070）。
因此，能够以非常快的速度、在如此高的语境下（我想也有 32k 标记）进行连贯的对话，这简直就是奇迹。

人们不敢想象，像Mistral7B这样一个随机的基础 LLM 会打败像 Meta 这样的大公司，但从目前来看，它确实做到了。如果 70B 型号能够扩展，其各项指标都有可能超过 GPT 3.5，甚至达到 GPT 4。

到目前为止，我们从预 LLAMA 时代（GPT-J 不连贯的胡言乱语）-> LLAMA（还好，但并不真正连贯，微调使其有点连贯，7B 模型无法使用）-> LLAMA 2（小型模型甚至连贯，但时间不长，微调效果很好，但 7B 模型仍在挣扎）-> Mistral 7B（与基本模型和小型模型连贯，微调仍是未知数）。所有这些都发生在一年之内

操作系统的速度令人叹为观止。

AI角色扮演之王：Mistral7B

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道