大语言模型LLM - 第3页

本文介绍ds4.c项目，一个专为DeepSeek V4 Flash模型设计的轻量级推理引擎。它采用Metal图形计算，支持超长上下文和磁盘KV缓存，强调端到端的本地运行体验。这个引擎到底是啥

著名AI大神卡帕西Andrej Karpathy宣布加入Anthropic。本文白活他为啥跳槽、以及这事儿对普通人和整个AI圈意味着什么，重点分析了人才流动背后的逻辑和行业影响。大神跳槽了

谷歌推出 Gemini 3.5 Flash，价格比前代暴涨三倍。深入分析发现它性能虽强但更贵，更耗 token，速度提升不划算，性价比被中国开源模型反杀。 Gemini 3.5 Flash 发布：一场华丽但烧钱的“速度与激情”

抛弃Claude Code转投Codex？两周深度使用后的真相大揭秘！一位开发者分享从Claude Code切换到Codex两周后的真实感受，从费用、代码质量、公司透明度和稳定性等角度对比了两款AI编程工具的优劣，并给出了实用的工具选择建议。

马斯克刚刚解散了 xAI 这家独立公司，并向美国专利商标局提交了“SpaceXAI”商标申请。时间线： 2025 年 3 月：xAI 以 330 亿美元收购 X（Twitter）。 2026 年 2 月：SpaceX 收购 x

研究人员用AI工具Mythos Preview，五天内在苹果M5芯片上攻破了苹果耗资数十亿美元打造的内存安全系统MIE，这是公开的首个案例。他们亲自到苹果总部提交报告，完整技术细节待苹果修复后公开。作者背景

AI找漏洞没那么神！Mythos扫描curl只中一个！Mythos AI扫描curl代码库只发现一个真实漏洞，远低于媒体炒作。文章对比多种AI扫描工具效果，说明现代AI确实能发现安全缺陷，但未超越已有工具水平。作者背景

2026年皇家学会期刊重磅论文认为，今天的大模型更像会背答案的“语言老虎机”，真正的人类智能依赖因果世界模型、自我建模、具身行动与长期目标结构，AGI距离现实仍隔着一整套生命系统。世界模型正在拆穿AGI幻觉：Royal Society论文集为何认

我花了三天让M4笔记本自己跟自己聊天，结果它把我的代码搞砸了！在苹果M4芯片24GB内存的MacBook上运行本地大模型的全流程实战。从选工具踩坑到调参数翻车，最终搞定Qwen模型实现每秒40个token，附赠真实翻车案例和配置文件。

很多人爱说“大模型就是猜下一个词”，这话气死人！你肯定听过这个说法。有人一聊AI，就来一句“大模型不过是个高级版输入法”。听起来挺酷，好像一下子看透了本质。但我听到这种话，就像听到有人说“梅西不就是把球踢进门吗”。对，技术上不能说错，但你完全错过了精彩部分。

对比Opus 4.7与GPT 5.5的真实体验。结论是两者优势互补，而非单一胜出。Claude更适合计划与长篇推理，GPT在严格实现与代码修复上更强。结合使用是最佳策略。 Opus 4.7 更懂计划，GPT 5.5 更会执行

Anthropic为了获得更多计算资源，租下了SpaceX为Grok建的巨型数据中心。这背后是一场精明的商业互惠：Anthropic拿到救命算力，SpaceX在IPO前有了漂亮营收，而马斯克则用对手的钱养着自己的硬件，顺便给OpenAI添堵。敌人的敌人是

大型语言模型证明，语言不需要指向现实就能产生连贯内容。本文解释语言如何靠自身内部关系生成语言、图像和行动，颠覆传统“语言描述现实”的观点。期刊信息IAI TV，2025年3月，原文标题《LLMs sho

Anthropic即将拆分Claude订阅与自动化调用计费，独立开发者首当其冲面临后台Agent和GitHub Action的GPU成本反噬。文章揭露了过去两年AI公司对程序员的巨额补贴，并提供了控制Token消耗的工程思路。 Claude订阅拆分API计

Anthropic 塔里克·希希帕尔（Thariq）发表一篇引人深思的文章，他认为对于大多数人工智能用例，我们应该

你的手机本就足够聪明，别再傻等服务器了！本文批判开发者盲目依赖云端AI接口，指出这会导致软件脆弱、侵犯隐私。作者通过自己开发的新闻应用实例，展示了如何利用苹果设备内置模型实现本地文本摘要，强调多数功能无需云端，本地处理更快更安全，并提供了具体代码和结构化的输出方法。

Cloudflare实测Mythos：发现它能串烧多个低危漏洞生成完整攻击代码。此前沿模型只会报告可疑线索，现可直接动手修复。模型需加装护栏才能发布。这个AI太猛了，猛到自家安全主管喊停

西奈山的研究人员让人工智能执行最基本的医院管理任务：统计病人数量、按年龄筛选、应用排除标准。这些都是数据分析师每天都会做的简单表格操作。人工智能失败了。即使是只有 25 行的表格也失败了。并非因为它不