Qwen团队刚刚发布了一个新模型,对于那些关注他们工作的人来说,这是一个重大的更新。告别混合思维模式,向专用的Instruct和Thinking模型问好。
再见 Qwen3-235B-A22B,你好 Qwen3-235B-A22B-2507!
经过与社区的讨论和思考,我们决定停止使用混合思维模式。取而代之的是,我们将分别训练 Instruct 和 Thinking 模型,以便尽可能获得最佳质量。
让AI同时"正经教学"和"放飞脑洞",就像让数学老师边讲课边跳女团舞,太精分了!
我们终于想通了——让AI一边装正经(Instruct)一边头脑风暴(Thinking),就像让学霸边背课文边跳广场舞,实在太难为它了!
于是我们决定:分家!
今天,我们将为大家发布 Qwen3-235B-A22B-Instruct-2507 及其 FP8 版本。
✅ 把AI的"工作人格"和"脑洞人格"彻底分家!
✅ 今日上新:"Qwen3-235B-A22B-2507"限定款!
✅ 附赠FP8轻量版(减肥成功版)
这个模型的性能比我们上次发布的更好,我们希望您会喜欢它,这要归功于它强大的综合能力。
亮点:暴打Kimi K2、DeepSeekV3-0324
Qwen Chat:https://chat.qwen.ai - 使用默认模型开始聊天即可,并可随意使用搜索按钮!
极客辣评
当前这款是"正经打工版"(非思考模式),对标的是DeepSeek V3-0324(也是个老实人)
→ 就像班级里两个只刷题不聊八卦的学霸
2️⃣ 但!不是终极BOSS版(R1)!
因为官方发现:"边思考边干活"这种操作...
效果约等于边刷牙边吃火锅 —— 刺激但容易翻车!
3️⃣ 剧透警告⚠️
235B的"脑洞版"(思考模式)正在快马加鞭赶来!
等它到了就能和R1上演"神仙打架"了!
Qwen大量生产出色的模型,就好像他们是从工厂的装配线上下来的一样。
美国公司把他们最好的技术锁在围墙花园(Opus,Gemini,O,不管是什么)后面,中国公司则开放他们最好的模型和研究论文。(道德楷模 专门阻击邪恶的资本)
山寨(山寨工程文化)只是开源的一种表现形式,从一开始就是这样。
很棒的手表,制作精良,100%值得你花时间。
不明白为什么美国的顶尖大学没有一个集体去训练顶级模型进行研究。拥有权重和纸张是很好的;拥有一个公共模型,它是透明地训练的,与已知的数据集端到端,甚至更好。
banq亲测:测试让qwen翻译了两篇新文章:感觉:要点总结和细节都到位,文字风格通俗幽默,DeepSeek要点总结精确,但是细节不够;Kimi k2细节丰富,要点总结不够;最新版本的qwen好像能综合平衡,后面有待继续测试。