微软发布Phi 4 Reasoning(14b)：内存减半

#本地小语言模型 #大语言模型LLM

2025-05-01 banq

Phi-4-reasoning是一种最先进的开放权重推理模型，它是在Phi-4的基础上进行微调的，使用的是对思想链跟踪和强化学习数据集的监督微调。

Phi-4推理小能手就像你们班那个数学突然开窍的同学——本来是个普通学生（Phi-4基础版），但老师给他吃了小灶（微调），专门训练他"把解题步骤一步步写出来"（思想链跟踪），还让他做了好多奥数题（强化学习数据集）。

它吃的"营养餐"可讲究了：一半是网上找的模拟题（合成提示），一半是重点中学的真题（高质量过滤数据），主要练数学、科学和编程这三门主科。还特意学了《学生行为规范》（安全和对齐数据），防止它变成乱解题的熊孩子。

说白了就是：把模型当特长生培养，不搞题海战术，专攻精品题库，让这个小个子模型（小型模型）也能做出学霸级别的烧脑题（高级推理）！

网友：
1、Phi 这哥们儿可不得了，跟数码宝贝似的，一路升级打怪！虽然前三个版本（Phi-1、2、3）都是"一次性体验卡"——当时挺牛，但很快被超越。可Phi-4不一样，它是真·实力派，硬盘再挤也得给它腾地儿！

AI班的"四大金刚"：

Phi-4是小型模型里的六边形战士，而AI江湖的竞争，比你们追番还刺激.

2、如果Phi-4这货的胃口（内存占用）只有Qwen 30B MOE的一半，但智商（性能）差不多，那还犹豫啥？赶紧上车啊！

尤其是你们那些16GB内存的破笔记本（比如还在用老款MacBook Air的兄弟），跑不动那些“巨无霸”模型，Phi-4简直就是你们的救命稻草！

至于14B MOE……（扶额）这玩意儿砍得有点狠，“不知道它还剩几个脑细胞，别是个被切了前额叶的傻子吧？”（参考：医学上的“脑叶切除术”会让病人变呆滞，这里调侃模型砍参数量后可能变智障。）
总结：