Qwen3就是个爱动脑筋的'小机灵鬼'!每次你问它问题,它都会先在心里默默嘀咕一阵(就是那个
我发现 Qwen3-8B 也出人意料地擅长做一些有用的事情:
- 它可以总结短篇文章。
- 它可以根据问题和模式编写简单的 SQL 查询。
- 它可以通过读取 HTML 和 JavaScript 代码来理解一个简单的 Web 应用程序的功能。
- 它可以[url=https://gist.github.com/simonw/ac4082df0dcde87d5845586804fb80c9]编写 Python 代码[/url]来满足一段很长的规范
为此,它“推理”了很长时间,但最终还是得到了一个有用的答案。
所有这些都会消耗 4 到 5GB 的内存,具体取决于提示的长度。
我认为几 GB 的浮点数可以有效地完成这些不同的任务,这是非常了不起的,特别是使用如此少的内存,以至于它不会对我想同时在笔记本电脑上运行的其他程序造成影响。
总结:
- 虽然它思考的时候像考试时咬笔头的同学一样要琢磨很久(有时候能想上20秒!),但最后总能给出靠谱的答案。
- 这么厉害的大脑,居然只要占用4-5GB内存(相当于你手机里存两三部电影的空间),提示信息越长吃得内存就越多些。
- 说实话,就靠这几GB的内存(相当于几千个浮点数在脑子里转悠),能完成这么多花式任务,还能不耽误我同时刷剧打游戏,这技术简直不要太神奇!"
网友1:
我真的很喜欢相对较小的Qwen 3 -8B,在我的Mac上使用MLX运行4位量化版本。它的能力令人惊讶,因为它的下载量为4.3GB,运行时仅使用4-5GB的RAM。
网友2:
它是我运行的首选后台模型~使用它来总结和记录我的浏览器看到的所有内容;完美的大小和性能!