Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
大语言模型LLM
“指鹿为马”为何有意义?符号落地是世纪难题
符号接地(符号指引到物理世界,引用、指向的意思)问题,由Stevan Harnad哈纳德博士于1990年首次发现并发表。 什么是符号接地?符号指引到物理世界,引用、指向的意思,比如指鹿为马,如果你没有见过鹿
英伟达Rubin CPX预制菜重定义AI推理硬件架构
英伟达发布专为AI推理预填充阶段优化的Rubin CPX芯片,采用GDDR7显存与计算优先架构,较传统方案降低成本50%以上,推出三种机架配置最大支持396颗芯片,迫使竞争对手重新规划技术路线。 英伟达这次又让整个硅谷失眠了!就在昨天发布的Rubin CP
GPT5是AI泡沫破灭的开始 英伟达见顶
OpenAI的“滑铁卢”?AI反调大咖加里·马库斯(Gary Marcus)再次宣称:科学终于战胜了炒作?看到最后你才知道未必! 加里·马库斯(Gary Marcus)是谁?加里·马库斯(Gary Marcus)是
DeepSeek推DeepSeek V3.1基础型号 性能提升13%
DeepSeek在huggingface.co上开启了新的DeepSeek-V3.1-Base页面,尽管正在上传,页面是空白的,但是可以看出模型大小是685B参数 极客们沸腾了: 1、我敢肯定,他们就是在
GPT5 Codex神器封神!Claude和Gemini彻底败北
开发者深度对比Claude、Gemini和GPT5代码工具,发现GPT5驱动的Codex以一次成型的精准度实现碾压式优势! 程序员亲测AI编码工具巨变!GPT5代码功能封神,Claude和Gemini瞬间不香了!
DeepSeek首款混合模型V3.1超越自家R1推理模型
DeepSeek推出首款混合模型V3.1,在基准测试中超越自家R1推理模型 近日,DeepSeek公司正式发布了其首款混合人工智能模型DeepSeek-V3.1,该模型创新性地采用双模式运行机制,被官方称为"迈向智能体时代的第一步"。这一突破意味着Deep
谷歌Gemini独解世界编程难题:换个角度想问题
谷歌的人工智能模型“Gemini 2.5 Deep Think”,在世界顶级的编程竞赛ICPC总决赛上,不仅打败了无数人类天才,还解决了一道所有人类队伍都束手无策的难题。 大家可能听说过ICPC,中文叫国际大学生程序设计竞赛,被誉为“编程界的奥林匹克”。规
Gemini即将迎来‘Projects’功能:一键跨文件研究
谷歌正在给 Gemini(就是它家的 AI 聊天助手)开发一个全新的“项目(Projects)”功能。走的就是和 OpenAI 的 ChatGPT、Anthropic 的 Claude,还有马斯克的 Grok 一样的路子。
加里马库斯:扩展定律scaling-law神话已崩塌
GPT-5本应是人工智能的“游戏规则改变者”。这是OpenAI投入数十亿美元、花费近三年研发的成果。公司首席执行官 萨姆·奥特曼(Sam Altman) 暗示,它可能接近人工通用智能(AGI)——一种能够像人类专家一样聪明和灵活的 AI。 然而,现
预训练→微调→环境交互:AI学习范式的三次进化
Andrej Karpathy大神:在大语言模型的发展历史中,我们其实经历了几个不同的“学习时代”。 第一个时代是预训练(pretraining)时代。在这个阶段,最重要的就是大规模互联网文本。你需要尽可能
OpenAI暴击全球编程冠军!GPT5率队满分碾压人类谷歌
OpenAI在2025国际大学生编程竞赛全解12题,击败人类冠军与谷歌Gemini。采用GPT-5+实验模型双系统协作,未针对比赛特殊训练,展现超强通用推理能力。 OpenAI的新模型在2025年ICPC世界总决赛中获得了12/12的满分,Google模型
幽默:人与Grok4互怼,你名字证明你才是机器人
网友与Grok4互怼,你才是机器人,你全家都是。。。
直白揭秘:Transformer内部信息流动全图解,看完秒懂!
Transformer通过“残差流”垂直深化每个词的信息,同时用“键值流”在各层横向广播所有词的信息。注意力机制像“信息路由器”,让任意位置的词都能根据需求检索和融合上下文中的所有记忆,从而实现深度理解。 Transformer是一个巨大的信息加工厂,它的
在笔记本上5分钟能训练出的最强AI模型?
作者问了一个看似傻乎乎的问题:“我能在我的 MacBook Pro 上用 5 分钟训练出最强的 AI 模型吗?” 答案直接说:我训练出来的最佳模型是一个大约 180 万参数的 GPT 风格 Transformer,
Grok 4 Fast发布与马斯克5000亿财富巅峰
埃隆·马斯克财富突破5000亿美元,xAI发布Grok 4 Fast,以47倍成本优势和顶级性能称霸AI小模型,击败GPT-5 Mini,领跑LMArena搜索榜,展现科技与财富的双重巅峰。 埃隆·马斯克的财富巅峰与xAI的Grok 4 Fast:智能与效
DeepSeek用三百万人民币训练出顶级推理模型!
DeepSeek公布其R1模型训练成本仅29.4万美元,使用512颗H800芯片训练80小时。相比美国AI巨头动辄上亿美元的开销,这一结果震动全球,突显中国AI在低成本高效率上的突破,同时引发中美AI竞争新焦点。 中国DeepSeek再爆猛料!他们
OpenAI幻觉论文:为什么大语言模型会产生幻觉?
AI出现幻觉,一本正经胡说八道,根源不在技术缺陷,而在人类设计的考试制度。现有评测体系只奖蒙对,不奖诚实,逼得AI宁可瞎猜拿分,也不说我不知道。要治此病,须改革评分标准,让坦白成为最优解,坦白从宽,抗拒从严! 为啥你家那个号称啥都知道的AI助手,关
微软前员工揭秘:微软OpenAI分手?谷歌云或成王者!
来自一位前微软员工的独家见解,他曾经在微软内部与OpenAI(开放人工智能公司)合作过,对两家公司之间的关系有深刻洞察。 咱们这位作者,化名“前微软员工”,曾在微软的高层圈子里混迹,负责跟OpenAI的项目打交道,还曾是微软首席技术官办公室的常客。
上页
下页
关闭