大语言模型LLM

“指鹿为马”为何有意义？符号落地是世纪难题

符号接地（符号指引到物理世界，引用、指向的意思）问题，由Stevan Harnad哈纳德博士于1990年首次发现并发表。什么是符号接地？符号指引到物理世界，引用、指向的意思，比如指鹿为马，如果你没有见过鹿

英伟达Rubin CPX预制菜重定义AI推理硬件架构

英伟达发布专为AI推理预填充阶段优化的Rubin CPX芯片，采用GDDR7显存与计算优先架构，较传统方案降低成本50%以上，推出三种机架配置最大支持396颗芯片，迫使竞争对手重新规划技术路线。英伟达这次又让整个硅谷失眠了！就在昨天发布的Rubin CP

GPT5是AI泡沫破灭的开始英伟达见顶

OpenAI的“滑铁卢”？AI反调大咖加里·马库斯(Gary Marcus)再次宣称：科学终于战胜了炒作？看到最后你才知道未必！加里·马库斯(Gary Marcus)是谁？加里·马库斯（Gary Marcus）是

DeepSeek推DeepSeek V3.1基础型号性能提升13%

DeepSeek在huggingface.co上开启了新的DeepSeek-V3.1-Base页面，尽管正在上传，页面是空白的，但是可以看出模型大小是685B参数极客们沸腾了： 1、我敢肯定，他们就是在

GPT5 Codex神器封神！Claude和Gemini彻底败北

开发者深度对比Claude、Gemini和GPT5代码工具，发现GPT5驱动的Codex以一次成型的精准度实现碾压式优势！程序员亲测AI编码工具巨变！GPT5代码功能封神，Claude和Gemini瞬间不香了!

DeepSeek首款混合模型V3.1超越自家R1推理模型

DeepSeek推出首款混合模型V3.1，在基准测试中超越自家R1推理模型近日，DeepSeek公司正式发布了其首款混合人工智能模型DeepSeek-V3.1，该模型创新性地采用双模式运行机制，被官方称为"迈向智能体时代的第一步"。这一突破意味着Deep

谷歌Gemini独解世界编程难题：换个角度想问题

谷歌的人工智能模型“Gemini 2.5 Deep Think”，在世界顶级的编程竞赛ICPC总决赛上，不仅打败了无数人类天才，还解决了一道所有人类队伍都束手无策的难题。大家可能听说过ICPC，中文叫国际大学生程序设计竞赛，被誉为“编程界的奥林匹克”。规

Gemini即将迎来‘Projects’功能：一键跨文件研究

谷歌正在给 Gemini（就是它家的 AI 聊天助手）开发一个全新的“项目（Projects）”功能。走的就是和 OpenAI 的 ChatGPT、Anthropic 的 Claude，还有马斯克的 Grok 一样的路子。

加里马库斯：扩展定律scaling-law神话已崩塌

GPT-5本应是人工智能的“游戏规则改变者”。这是OpenAI投入数十亿美元、花费近三年研发的成果。公司首席执行官萨姆·奥特曼（Sam Altman）暗示，它可能接近人工通用智能（AGI）——一种能够像人类专家一样聪明和灵活的 AI。然而，现

预训练→微调→环境交互：AI学习范式的三次进化

Andrej Karpathy大神：在大语言模型的发展历史中，我们其实经历了几个不同的“学习时代”。第一个时代是预训练（pretraining）时代。在这个阶段，最重要的就是大规模互联网文本。你需要尽可能

OpenAI暴击全球编程冠军！GPT5率队满分碾压人类谷歌

OpenAI在2025国际大学生编程竞赛全解12题，击败人类冠军与谷歌Gemini。采用GPT-5+实验模型双系统协作，未针对比赛特殊训练，展现超强通用推理能力。 OpenAI的新模型在2025年ICPC世界总决赛中获得了12/12的满分，Google模型

幽默：人与Grok4互怼，你名字证明你才是机器人

网友与Grok4互怼，你才是机器人，你全家都是。。。

直白揭秘：Transformer内部信息流动全图解，看完秒懂！

Transformer通过“残差流”垂直深化每个词的信息，同时用“键值流”在各层横向广播所有词的信息。注意力机制像“信息路由器”，让任意位置的词都能根据需求检索和融合上下文中的所有记忆，从而实现深度理解。 Transformer是一个巨大的信息加工厂，它的

在笔记本上5分钟能训练出的最强AI模型？

作者问了一个看似傻乎乎的问题：“我能在我的 MacBook Pro 上用 5 分钟训练出最强的 AI 模型吗？” 答案直接说：我训练出来的最佳模型是一个大约 180 万参数的 GPT 风格 Transformer，

Grok 4 Fast发布与马斯克5000亿财富巅峰

埃隆·马斯克财富突破5000亿美元，xAI发布Grok 4 Fast，以47倍成本优势和顶级性能称霸AI小模型，击败GPT-5 Mini，领跑LMArena搜索榜，展现科技与财富的双重巅峰。埃隆·马斯克的财富巅峰与xAI的Grok 4 Fast：智能与效

DeepSeek用三百万人民币训练出顶级推理模型！

DeepSeek公布其R1模型训练成本仅29.4万美元，使用512颗H800芯片训练80小时。相比美国AI巨头动辄上亿美元的开销，这一结果震动全球，突显中国AI在低成本高效率上的突破，同时引发中美AI竞争新焦点。中国DeepSeek再爆猛料！他们

OpenAI幻觉论文：为什么大语言模型会产生幻觉？

AI出现幻觉，一本正经胡说八道，根源不在技术缺陷，而在人类设计的考试制度。现有评测体系只奖蒙对，不奖诚实，逼得AI宁可瞎猜拿分，也不说我不知道。要治此病，须改革评分标准，让坦白成为最优解，坦白从宽，抗拒从严！为啥你家那个号称啥都知道的AI助手，关

微软前员工揭秘：微软OpenAI分手？谷歌云或成王者！

来自一位前微软员工的独家见解，他曾经在微软内部与OpenAI（开放人工智能公司）合作过，对两家公司之间的关系有深刻洞察。咱们这位作者，化名“前微软员工”，曾在微软的高层圈子里混迹，负责跟OpenAI的项目打交道，还曾是微软首席技术官办公室的常客。