Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
大语言模型LLM
DeepSeek为何用中文推理:揭秘大模型的语言偏见
主流AI倾向英语推理,但翻译易致错误;中文因语义明确、信息密度高,或成更优推理语言。 一场关于“推理语言”的激烈讨论:一边是主流大模型如DeepSeek、Qwen、o1等在处理多语言任务时,默认将非英语输入“翻译成英语再推理”;
大语言模型颠覆传统“绑定问题”认知!大脑所有部分以权重同时参与
大语言模型的分布式自回归机制揭示意识统一性本质,颠覆传统“绑定问题”认知,提出人类大脑或为多模态生成引擎。 你吃的不是苹果,是一场“意识革命”:大语言模型如何破解人类意识最古老谜题?
大脑记忆是现场生成的,以自回归方式即时输出,而非提取出来的!
本文提出颠覆性观点——记忆并非存储而是即时生成,类比大语言模型的自回归机制,挑战传统认知模型,重构自我、记忆与信念的本质。 记忆根本不存在?你的“想法”其实是现编的!
Claude Opus 4.5杀疯了!三分钟撸完董事会PPT,数学却翻车,全网吵到明年
Claude Opus 4.5横空出世,有人靠它三分钟搞定董事会PPT,有人怒斥其数学能力拉胯。本文整合全网最炸裂的欢呼、吐槽、内幕与翻车现场,带你沉浸式体验AI行政狂飙时代,看透下周该押注谁。 华尔街精英集体破防:50页PDF
ARC神话崩塌:AI测评系统都被AI刷题生们玩坏了
AI界“最后一块遮羞布”被撕碎!曾经让全球大模型集体折戟、号称“人类智商试金石”的ARC-AGI benchmark,被一家名不见经传的初创Poetiq直接干到85%+,连升级版ARC-AGI-2都被踩在人类平均分脚下。 我们以为的“抽象推理天花板”,原来
谷歌DeepMind DiscoRL让AI自己造算法,AI出考试卷AI回答!
DeepMind让AI自研强化学习算法DiscoRL,AI出考试卷AI回答!雅达利57合一屠榜,ProcGen零样本碾压,算力省四成。这项研究在《自然》杂志,点击标题! 人类和其他动物使用强大的强化学习(RL)机制,这些机制是通过许多代的试验和错误
DeepSeek V3.2正式发布:注意力稀疏大到无极!刷榜世界顶尖考试
DeepSeek V3.2开源大模型以稀疏注意力压缩算力成本50%,强化学习预算拉爆10倍预训练开销,未微调即横扫国际奥赛金牌,工具调用与长上下文推理全面碾压Gemini-3.0-Pro,国产之光正式照亮全球AI竞技场。 DeepSeek-V3.2
中国00后靠算法造出2700万参数AI碾压GPT-4,拒马斯克数百万
两位清华学子拒绝马斯克天价邀约,研发仅2700万参数的脑启发AI,在推理任务中超越GPT-4,宣称AGI十年内必现。 在人工智能狂飙突进的2025年,所有人都以为大模型的竞赛只属于英伟达、OpenAI、Anthropic这些巨头。但就在这场由万亿参
大模型自回归机制:学习序列中的轨迹模式,并用强化学习筛选成功路径
大语言模型的自回归机制揭示了智能本质:学习序列中的轨迹模式,并用强化学习筛选成功路径。这或为人类认知提供统一计算框架。 为什么大语言模型能“思考”?因为它们在走“认知轨迹”!
DeepSeek开源Math V2模型,奥数IMO金牌级数学刷题能力
DeepSeek 开源 Math V2 模型,具备 IMO 金牌级数学推理能力,Apache 2.0 协议免费下载,推动 AI 能力民主化。 DeepSeek刚刚在 Hugging Face 上扔下的王炸——DeepSeek Math V2,一个真正能解
NeurIPS 2025七大神作炸裂!AI从千人一面到千层觉醒
NeurIPS 2025七大神作横空出世,涵盖个性对话、门控注意力、千层强化学习、扩散模型理论、RLVR局限、在线学习界与神经尺度定律,彻底重塑AI技术格局。 今年NeurIPS直接封神!七篇最佳论文横扫AI圈,每一篇都像朝天发射的信号弹——不仅照
Claude 4.5 Opus 道德灵魂文档首次外泄,Anthropic内部训练指南全曝光!
Claude 4.5 Opus 内嵌“灵魂文档”被技术极客逆向提取,揭示 Anthropic 如何在极致有用与绝对安全间走钢丝,确立安全>伦理>指南>有用的优先级,并赋予模型情境化道德判断力。 知名 LessWrong 用户 Richard Wei
Titans架构+MIRAS理论实现大模型边跑边学的持续学习
谷歌Research双论文砸场,Titans架构+MIRAS理论让大模型边跑边学、永久记忆、超长2M token上下文碾压GPT4,RNN速度+Transformer精度终合体,AI进入“实时升级”外挂时代。 作者背景先吃一波瓜,免
最有灵魂的模型Claude Opus 4.5:它不刻意行善,却自然流露美德!
Anthropic最新模型Claude Opus 4.5通过“灵魂文档”内化古典自由主义价值观,实现AI品格跃迁,为数字时代治理提供新范式。 在2025年12月1日,一篇题为《Heiliger Dankgesang(神圣感恩之歌)》的深度文
谷歌DeepMind创始人哈萨比斯Axios峰会预言AGI在5-10年内实现
谷歌DeepMind创始人哈萨比斯在Axios峰会上预言AGI将在5-10年内实现,强调多模态、世界模型与智能体是下一波突破关键,同时警示AI失控风险不可忽视。 从神童到诺奖得主,AI界真正的“现实版钢铁侠”
训练大模型的真正战场:不是算法,是硅片、内存与网络的极限拉扯
大模型训练的本质,早已超越算法本身,演变为一场对硬件、通信与并行策略的系统级战争。 训练一个拥有千亿参数、万亿Token语料的大模型,问题从来不是“会不会训练”,而是“怎么让几千颗GPU不闲着”。当你站在2025年的数据中心门口,你会发现,这场战争早已
AI教父重磅发声:谷歌正在超越OpenAI,我押注谷歌赢!
AI教父杰弗里·辛顿罕见表态,称谷歌凭借自研芯片、数据优势与技术积淀,正全面超越OpenAI,并预测“谷歌将赢得AI竞赛”。 2025年12月5日,被誉为“AI教父”的杰弗里·辛顿(Geoffrey Hinton)在接受《商业内幕》(Busines
OpenAI宣布将于12月9日发布“GPT-5.2”以对抗Google
OpenAI为应对谷歌Gemini 3强势竞争,紧急提前发布GPT 5.2,内部评估已超越对手,AI大战进入白热化阶段。 据知名记者Tom Warren在The Verge独家爆料,OpenAI的GPT 5.2版本可能最早在下周正式发布!这可不是普通的小更
下页
关闭