Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
元学习
DeepSeek核心贡献:将SFT和RL统一的数学公式
OpenAI首席研究官肯定了DeepSeek的核心成果:通过强化学习自动生成了思维链(这些归功于DeepSeek的统一数学公式),详细见:DeepSeek秘诀:能在学习过程中
如何为你的OpenClaw智能体构建九个元学习循环
智能体在单次会话内很聪明,但在跨会话之间很愚蠢。解决办法是在智能体的文件中建立结构化的反馈循环:失败变成护栏,预测变成校准,摩擦变成信号。从一个回归列表开始,其余的效应会在此基础上叠加。你的智能体正在重复上周犯过的错误,还有上上周的。
知识越便宜,见解越珍贵:chiddush与杰文斯悖论如何重塑学习
当ChatGPT开始替你翻书,真正值钱的人已经偷偷换赛道了:获取知识变得像查天气一样简单,真正的瓶颈不再是“知道什么”,而是“能想出什么新东西”。 本文用经济学家杰文斯的悖论解释:知识越廉价,创造新见解的需求就越爆炸。这就像犹太学习传统中,当查资料的成本几
什么是超级学习法?
Ultralearning: 斯科特-扬所著《掌握高难度技能,超越竞争对手,加速你的职业生涯》,作者在一年内学会了麻省理工学院的全部计算机科学课程。