Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
元学习
DeepSeek核心贡献:将SFT和RL统一的数学公式
OpenAI首席研究官肯定了DeepSeek的核心成果:通过强化学习自动生成了思维链(这些归功于DeepSeek的统一数学公式),详细见:DeepSeek秘诀:能在学习过程中
如何为你的OpenClaw智能体构建九个元学习循环
智能体在单次会话内很聪明,但在跨会话之间很愚蠢。解决办法是在智能体的文件中建立结构化的反馈循环:失败变成护栏,预测变成校准,摩擦变成信号。从一个回归列表开始,其余的效应会在此基础上叠加。你的智能体正在重复上周犯过的错误,还有上上周的。
什么是超级学习法?
Ultralearning: 斯科特-扬所著《掌握高难度技能,超越竞争对手,加速你的职业生涯》,作者在一年内学会了麻省理工学院的全部计算机科学课程。