大语言模型LLM - 第11页

OpenAI给AI加上了"记忆功能"，这可能是GPT-3问世以来最重大的升级。简单来说就是：以前的人工智能就像个特别聪明但记性差的朋友。就像那种知识渊博的教授，能回答各种难题，但连你的生日都记不住。

在推出GPT-4.5不到两个月后，OpenAI又发布了一个重要版本。周一，这家人工智能研究机构在其 API 中发布了 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。此次发布不仅包含了 OpenAI 首个 nano AI 模型，该公司还声称这三个新的 GPT-4.1

Llama 4 Scout模型发布了，它能一口气读1000万个字（相当于1万3千页书[1]），网上又有人喊"RAG技术没用了"……每次有新的大容量AI模型出来，这种争论就会冒头。今天我就来说说为啥我觉得RAG不会消失，就算AI能读更多文字了，RAG照样有用。

MAI-DS-R1 是一个 DeepSeek-R1 推理模型，经过微软 AI 团队的后期训练，旨在填补先前版本模型中的信息空白，并提升其风险状况，同时保持 R1 推理能力。该模型使用来自Tulu 3 SFT 数据集的 11 万个安全和不合规示例进行训练，此外还使用了内部开发的约 35 万个多

Google DeepMind文章《The Era of Experience》由David Silver和Richard S. Sutton撰写，探讨了人工智能领域即将进入的新时代——体验时代（The Era of Experience）。文章指出，AI的发展正站在一个新

Google新出的Gemma 3 QAT模型能让普通显卡用户也能用上顶级AI。这个经过特殊优化（QAT）的int4版本Gemma 3，把显存需求从54GB暴降到14.1GB，但效果几乎没打折。简单说，QAT就像给AI做特训：普通

全新开源型号 GLM-4-32B，性能媲美 Qwen 2.5 72B 该模型来自 ChatGLM（现为 Z.ai）。此外，还提供推理版、深度研究版和 9B 版（共 6 个模型）。MIT 许可证。

当我提到“大型语言模型”时，你首先想到的是什么？可能是像 ChatGPT、Gemini、Claude 或 Meta 的 LLaMA 这样的模型——对吧？如果我问你这些模型的驱动力是什么？答案几乎总是相同的——GPU 。昂贵、耗电的 GPU，通常都来自一家公司：NVIDIA。

以下是 Google AI Studio 最新升级和新的 Gemini 2.5 Flash 模型 API 的亮点： Google AI Studio 升级亮点：新增 Starter Apps：一个重要的新增功能是

我们搞了个AI模型"闪电启动器"，让大模型像Windows休眠功能一样秒开秒关！以前跑AI大模型特别麻烦——每次用都要重新加载，像开电脑等系统启动一样慢，而且显卡内存根本塞不下几个模型。现在我们搞出了新方法，2-5秒就能唤醒一个AI（130亿到650亿参

现在AI发展得特别火对吧？但有个挺吓人的事儿——咱到现在都不知道该怎么判断这些AI到底有多聪明、多有创意或者多会共情。为啥呢？因为现在用的测试方法全是照着人类标准设计的，本来就不适合测AI。最近我们还发现，就算改改题目的说法，AI的考试成绩都能差

微软研究人员表示，他们已经开发出一种可在 CPU 上运行的超高效 AI 模型微软的研究人员说，他们造出了目前为止最大的“1比特”人工智能模型，这个模型也叫“bitnet”。这个模型叫 BitNet b

OpenAI首席科学家Ilya Sutskever曾经打过一个比方：为什么让AI预测下一个词就能练出智能？这就好比看侦探小说——如果你能根据前面的线索推理出最后一页的凶手是谁，那才叫真正读懂了故事。️‍♂️ 受这个启发，我们决定用《逆转裁判》游戏来测试AI

随着训练数据增加，模型量化需更高精度（如2位→3位）。8位通常够用，但长训练可能饱和。微软Bitnet模型理论高效（低比特硬件优势），但缺乏支持，训练成本高。谷歌Ge

OpenAI 今天发布了 OpenAI o3 和 o4-mini，这是最新的 o 系列模型，经过训练后，可以在做出反应前进行更长时间的思考。这是他们迄今为止发布的最智能的模型，代表着 ChatGPT 功能的一次重大飞跃，适用于从好奇的用户到高级研究人员的所有人。

OpenAI最新提示指南中有两点挺有意思的，用大白话翻译就是：如果你要输入很长的内容，记得把你的要求（指令）在开头和结尾各写一遍要是你觉得麻烦不想写两遍，那至少要把你的要求放在最开头

OpenAI即将推出的推理模型。推文提到： OpenAI的新安全博客表示，其模型即将能够创造新的科学。有报道称，OpenAI的新推理模型可以在不同领域的概念之间建立联系，以建议新的实验类型。 OpenAI的首席财务官（CFO）几天前表示，使用其模型的科学家可能已经能

Marginal Revolution 是一个知名的经济学博客，由乔治梅森大学的经济学教授泰勒·考恩(Tyler Cowen) 和 Alex Tabarrok 共同创立。泰勒·考恩还撰写了多本书籍，涉及经济学、全球化、创新和文化等多个领域。他的著