Qwen3-8B：本地推理小钢炮

#本地小语言模型 #DeepSeek时刻 #芯片半导体

2025-05-03 banq

Qwen3 是一个“推理”模型，所以它每个提示都以一个包含其思维链的区块开头。
Qwen3就是个爱动脑筋的'小机灵鬼'！每次你问它问题，它都会先在心里默默嘀咕一阵（就是那个标签里的内容），把解题步骤都想明白了才回答你。

我发现 Qwen3-8B 也出人意料地擅长做一些有用的事情：

它可以总结短篇文章。
它可以根据问题和模式编写简单的 SQL 查询。
它可以通过读取 HTML 和 JavaScript 代码来理解一个简单的 Web 应用程序的功能。
它可以[url=https://gist.github.com/simonw/ac4082df0dcde87d5845586804fb80c9]编写 Python 代码[/url]来满足一段很长的规范

为此，它“推理”了很长时间，但最终还是得到了一个有用的答案。

所有这些都会消耗 4 到 5GB 的内存，具体取决于提示的长度。

我认为几 GB 的浮点数可以有效地完成这些不同的任务，这是非常了不起的，特别是使用如此少的内存，以至于它不会对我想同时在笔记本电脑上运行的其他程序造成影响。

总结：

网友1：
我真的很喜欢相对较小的Qwen 3 -8B，在我的Mac上使用MLX运行4位量化版本。它的能力令人惊讶，因为它的下载量为4.3GB，运行时仅使用4-5GB的RAM。

网友2：
它是我运行的首选后台模型~使用它来总结和记录我的浏览器看到的所有内容;完美的大小和性能！