AI角色扮演之王:Mistral7B

就其规模大小而言,Mistral7B是 RP 新的操作系统之王,甚至比 LLAMA-2 13B 更好。

但模型本身真的非常非常好。虽然还达不到 GPT 3.5 的质量,但它绝对能胜任连贯的角色扮演(这几乎是这种规模的主要用途,因为为什么要用一个低劣的模型来做任何有意义的事情)。

可以与不同的角色进行了多次 次对话,不仅连贯而且愉快。推理也很接近,虽然不是很完美。

可实现与一个角色进行过非常稳定的角色扮演:进行大概有 100 条聊天信息时,才会出现了小模型的疯狂现象。但我们必须明白,这完全不是微调。它只是一个基础模型。因此,它能在不进行微调的情况下走到这一步已经非常了不起了。

Mistral7B的速度让它在角色扮演中表现出色:因为它的响应时间通常只有 4 秒(RTX 3070)。
因此,能够以非常快的速度、在如此高的语境下(我想也有 32k 标记)进行连贯的对话,这简直就是奇迹。

人们不敢想象,像Mistral7B这样一个随机的基础 LLM 会打败像 Meta 这样的大公司,但从目前来看,它确实做到了。如果 70B 型号能够扩展,其各项指标都有可能超过 GPT 3.5,甚至达到 GPT 4。

到目前为止,我们从预 LLAMA 时代(GPT-J 不连贯的胡言乱语)-> LLAMA(还好,但并不真正连贯,微调使其有点连贯,7B 模型无法使用)-> LLAMA 2(小型模型甚至连贯,但时间不长,微调效果很好,但 7B 模型仍在挣扎)-> Mistral 7B(与基本模型和小型模型连贯,微调仍是未知数)。所有这些都发生在一年之内

操作系统的速度令人叹为观止。