• 谷歌推出 Gemini 3.5 Flash,价格比前代暴涨三倍。深入分析发现它性能虽强但更贵,更耗 token,速度提升不划算,性价比被中国开源模型反杀。 Gemini 3.5 Flash 发布:一场华丽但烧钱的“速度与激情” icon
  • 抛弃Claude Code转投Codex?两周深度使用后的真相大揭秘!一位开发者分享从Claude Code切换到Codex两周后的真实感受,从费用、代码质量、公司透明度和稳定性等角度对比了两款AI编程工具的优劣,并给出了实用的工具选择建议。 icon
  • 马斯克刚刚解散了 xAI 这家独立公司,并向美国专利商标局提交了“SpaceXAI”商标申请。 时间线:  2025 年 3 月:xAI 以 330 亿美元收购 X(Twitter)。  2026 年 2 月:SpaceX 收购 x icon
  • 研究人员用AI工具Mythos Preview,五天内在苹果M5芯片上攻破了苹果耗资数十亿美元打造的内存安全系统MIE,这是公开的首个案例。他们亲自到苹果总部提交报告,完整技术细节待苹果修复后公开。 作者背景 icon
  • AI找漏洞没那么神!Mythos扫描curl只中一个!Mythos AI扫描curl代码库只发现一个真实漏洞,远低于媒体炒作。文章对比多种AI扫描工具效果,说明现代AI确实能发现安全缺陷,但未超越已有工具水平。 作者背景 icon
  • 2026年皇家学会期刊重磅论文认为,今天的大模型更像会背答案的“语言老虎机”,真正的人类智能依赖因果世界模型、自我建模、具身行动与长期目标结构,AGI距离现实仍隔着一整套生命系统。 世界模型正在拆穿AGI幻觉:Royal Society论文集为何认 icon
  • 我花了三天让M4笔记本自己跟自己聊天,结果它把我的代码搞砸了!在苹果M4芯片24GB内存的MacBook上运行本地大模型的全流程实战。从选工具踩坑到调参数翻车,最终搞定Qwen模型实现每秒40个token,附赠真实翻车案例和配置文件。 icon
  • 很多人爱说“大模型就是猜下一个词”,这话气死人!你肯定听过这个说法。有人一聊AI,就来一句“大模型不过是个高级版输入法”。听起来挺酷,好像一下子看透了本质。但我听到这种话,就像听到有人说“梅西不就是把球踢进门吗”。对,技术上不能说错,但你完全错过了精彩部分。 icon
  • 对比Opus 4.7与GPT 5.5的真实体验。结论是两者优势互补,而非单一胜出。Claude更适合计划与长篇推理,GPT在严格实现与代码修复上更强。结合使用是最佳策略。 Opus 4.7 更懂计划,GPT 5.5 更会执行 icon
  • Anthropic为了获得更多计算资源,租下了SpaceX为Grok建的巨型数据中心。这背后是一场精明的商业互惠:Anthropic拿到救命算力,SpaceX在IPO前有了漂亮营收,而马斯克则用对手的钱养着自己的硬件,顺便给OpenAI添堵。 敌人的敌人是 icon
  •  大型语言模型证明,语言不需要指向现实就能产生连贯内容。本文解释语言如何靠自身内部关系生成语言、图像和行动,颠覆传统“语言描述现实”的观点。 期刊信息IAI TV,2025年3月,原文标题《LLMs sho icon
  • Anthropic即将拆分Claude订阅与自动化调用计费,独立开发者首当其冲面临后台Agent和GitHub Action的GPU成本反噬。文章揭露了过去两年AI公司对程序员的巨额补贴,并提供了控制Token消耗的工程思路。 Claude订阅拆分API计 icon
  • Anthropic 塔里克·希希帕尔(Thariq)发表一篇引人深思的文章,他认为对于大多数人工智能用例,我们应该 icon
  • 你的手机本就足够聪明,别再傻等服务器了!本文批判开发者盲目依赖云端AI接口,指出这会导致软件脆弱、侵犯隐私。作者通过自己开发的新闻应用实例,展示了如何利用苹果设备内置模型实现本地文本摘要,强调多数功能无需云端,本地处理更快更安全,并提供了具体代码和结构化的输出方法。 icon
  • Cloudflare实测Mythos:发现它能串烧多个低危漏洞生成完整攻击代码。此前沿模型只会报告可疑线索,现可直接动手修复。模型需加装护栏才能发布。 这个AI太猛了,猛到自家安全主管喊停 icon
  • 西奈山的研究人员让人工智能执行最基本的医院管理任务:统计病人数量、按年龄筛选、应用排除标准。这些都是数据分析师每天都会做的简单表格操作。 人工智能失败了。即使是只有 25 行的表格也失败了。 并非因为它不 icon