• DeepSeek把V4 Pro的75折临时优惠变成永久降价到原价1/4,缓存价格降到1/10,开发者疯狂迁移 DeepSeek公司把临时打折改成了永久降价 这家公司之前搞了个七五
  • 著名AI大神卡帕西Andrej Karpathy宣布加入Anthropic。本文白活他为啥跳槽、以及这事儿对普通人和整个AI圈意味着什么,重点分析了人才流动背后的逻辑和行业影响。 大神跳槽了 icon
  • 谷歌推出 Gemini 3.5 Flash,价格比前代暴涨三倍。深入分析发现它性能虽强但更贵,更耗 token,速度提升不划算,性价比被中国开源模型反杀。 Gemini 3.5 Flash 发布:一场华丽但烧钱的“速度与激情” icon
  • 一个通用AI模型推翻了离散几何领域存在四十年的核心猜想,证明单位距离图可以打破线性增长的限制。这项突破来自纯对话式AI,无需专业工具,其思路链长达125页,展示了AI跨界连接代数数论与组合几何的独特能力。 icon
  • 研究人员用AI工具Mythos Preview,五天内在苹果M5芯片上攻破了苹果耗资数十亿美元打造的内存安全系统MIE,这是公开的首个案例。他们亲自到苹果总部提交报告,完整技术细节待苹果修复后公开。 作者背景 icon
  • 2026年皇家学会期刊重磅论文认为,今天的大模型更像会背答案的“语言老虎机”,真正的人类智能依赖因果世界模型、自我建模、具身行动与长期目标结构,AGI距离现实仍隔着一整套生命系统。 世界模型正在拆穿AGI幻觉:Royal Society论文集为何认 icon
  • 很多人爱说“大模型就是猜下一个词”,这话气死人!你肯定听过这个说法。有人一聊AI,就来一句“大模型不过是个高级版输入法”。听起来挺酷,好像一下子看透了本质。但我听到这种话,就像听到有人说“梅西不就是把球踢进门吗”。对,技术上不能说错,但你完全错过了精彩部分。 icon
  • 对比Opus 4.7与GPT 5.5的真实体验。结论是两者优势互补,而非单一胜出。Claude更适合计划与长篇推理,GPT在严格实现与代码修复上更强。结合使用是最佳策略。 Opus 4.7 更懂计划,GPT 5.5 更会执行 icon
  •  大型语言模型证明,语言不需要指向现实就能产生连贯内容。本文解释语言如何靠自身内部关系生成语言、图像和行动,颠覆传统“语言描述现实”的观点。 期刊信息IAI TV,2025年3月,原文标题《LLMs sho icon
  • Gemini 3.5 Flash在Agent工作流测试中登顶,让很多人误以为它成了编程宇宙总冠军。问题在于它赢下的是“会干活比赛”,很多人测的却是“会考试比赛”。速度、长任务能力和深度推理能力正在走向不同赛道。 APEX排行榜让所有 icon
  • Anthropic即将拆分Claude订阅与自动化调用计费,独立开发者首当其冲面临后台Agent和GitHub Action的GPU成本反噬。文章揭露了过去两年AI公司对程序员的巨额补贴,并提供了控制Token消耗的工程思路。 Claude订阅拆分API计 icon
  • 谷歌发布Gemini Omni,一个能理解物理规律和背景知识的视频生成模型。它能将文字、图片、音频混在一起生成视频,还支持像聊天一样改视频。 以后剪视频可能就是跟AI打电话聊天 icon
  • 本文拆解一种把大脑看成“自回归生成器”的统一理论。核心观点很简单:大脑每时每刻都在预测下一个体验状态。记忆、注意力、知觉、思考、自我感,像一群看着不同窗口上班的人,实际都在同一个流水线里拧螺丝。 作者背景:Autoregressive Brain项 icon
  • SpaceXAI 跟 AI 公司 Anthropic 签了每月 12.5 亿美元的算力合同。文章把来龙去脉、谁赚谁亏、为什么敢签这么大单全讲清楚,最后还有藏在合同里的小后门。 AI 公司给火箭公司打钱 每月十几亿美元就为抢显卡 icon
  • Cloudflare实测Mythos:发现它能串烧多个低危漏洞生成完整攻击代码。此前沿模型只会报告可疑线索,现可直接动手修复。模型需加装护栏才能发布。 这个AI太猛了,猛到自家安全主管喊停 icon
  • 西奈山的研究人员让人工智能执行最基本的医院管理任务:统计病人数量、按年龄筛选、应用排除标准。这些都是数据分析师每天都会做的简单表格操作。 人工智能失败了。即使是只有 25 行的表格也失败了。 并非因为它不 icon
  • 谷歌DeepMind开发的人工智能系统,在无人帮助的情况下,自己证明了9道几十年没人能解的数学难题。每道题的解题成本只有几百美元,展示了AI在数学推理领域的强大能力。 数学难题现在成了白菜价 icon