智谱新开源GLM-4-32B媲美阿里Qwen2.5 72B

全新开源型号 GLM-4-32B，性能媲美 Qwen 2.5 72B

该模型来自 ChatGLM（现为 Z.ai）。此外，还提供推理版、深度研究版和 9B 版（共 6 个模型）。MIT 许可证。

Z.ai 是由智谱AI（北京智谱华章科技有限公司，Zhipu AI）运营的一个平台。智谱AI是一家成立于2019年的中国人工智能公司，由清华大学计算机系知识工程实验室孵化，专注于大模型研发。

GLM-4-0414 是智谱AI推出的一系列开源大模型的总称，包括基座模型 GLM-4-32B-Base-0414、推理模型 GLM-Z1-32B-0414、沉思模型 GLM-Z1-Rumination-32B-0414 以及 GLM-Z1-9B-0414 等。

这些模型以320亿或90亿参数为特点，性能比肩OpenAI的GPT系列和DeepSeek的V3/R1系列，支持工具调用、联网搜索、代码生成等智能体任务。

智谱AI通过 z.ai 平台（chat.z.ai）提供这些模型的免费体验入口，并将其开源（遵循MIT许可协议），允许商业用途和自由分发。公司还通过MaaS平台（bigmodel.cn）为企业和开发者提供API服务。智谱AI在2025年4月14日宣布启用 z.ai 作为其最新模型的交互体验入口，同时开源了上述模型系列。

网友：
1、我在chat.z.ai （他们的官方网站）上尝试了 Z1-32B ，到目前为止我只问了 2 个问题，它在两个问题中都陷入了无限循环，看起来不太好

2、目前，此模型的 Llama.cpp 实现已损坏：修复方法是 --override-kv tokenizer.ggml.eos_token_id=int:151336 --override-kv glm4.rope.dimension_count=int:64 --chat-template chatglm4

3、我感兴趣的只是推理过程中的函数调用。还有其他模型可以做到这一点吗？QwQ 很好，但在推理阶段调用函数，使用这个非常有用。GLM 推理可以在推理过程中进行函数调用。默认模板设置了 4 个用于执行网络搜索的工具，您可以更改模板。

4、我认为 GLM 系列模型的一个独特之处在于它们在预填充阶段使用了双向注意力机制。我真的很想知道这在规模上是否比其他 GPT 类模型更有优势。

智谱新开源GLM-4-32B媲美阿里Qwen2.5 72B

什么是Context上下文？

抽象两种方法：上下文与类型

Content与Context一字之差暗藏逆天极道

语境崩塌：你的注意力正被劫持

Context逻辑之道