• OpenAI给AI加上了"记忆功能",这可能是GPT-3问世以来最重大的升级。 简单来说就是:以前的人工智能就像个特别聪明但记性差的朋友。就像那种知识渊博的教授,能回答各种难题,但连你的生日都记不住。
  • 在推出GPT-4.5不到两个月后,OpenAI又发布了一个重要版本。周一,这家人工智能研究机构在其 API 中发布了 GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano。此次发布不仅包含了 OpenAI 首个 nano AI 模型,该公司还声称这三个新的 GPT-4.1
  • Llama 4 Scout模型发布了,它能一口气读1000万个字(相当于1万3千页书[1]),网上又有人喊"RAG技术没用了"……每次有新的大容量AI模型出来,这种争论就会冒头。今天我就来说说为啥我觉得RAG不会消失,就算AI能读更多文字了,RAG照样有用。 icon
  • MAI-DS-R1 是一个 DeepSeek-R1 推理模型,经过微软 AI 团队的后期训练,旨在填补先前版本模型中的信息空白,并提升其风险状况,同时保持 R1 推理能力。该模型使用来自Tulu 3 SFT 数据集的 11 万个安全和不合规示例进行训练,此外还使用了内部开发的约 35 万个多 icon
  • Google DeepMind文章《The Era of Experience》由David Silver和Richard S. Sutton撰写,探讨了人工智能领域即将进入的新时代——体验时代(The Era of Experience)。 文章指出,AI的发展正站在一个新 icon
  • Google新出的Gemma 3 QAT模型能让普通显卡用户也能用上顶级AI。这个经过特殊优化(QAT)的int4版本Gemma 3,把显存需求从54GB暴降到14.1GB,但效果几乎没打折。 简单说,QAT就像给AI做特训: 普通 icon
  • 全新开源型号 GLM-4-32B,性能媲美 Qwen 2.5 72B 该模型来自 ChatGLM(现为 Z.ai)。此外,还提供推理版、深度研究版和 9B 版(共 6 个模型)。MIT 许可证。 icon
  • 当我提到“大型语言模型”时,你首先想到的是什么?可能是像 ChatGPT、Gemini、Claude 或 Meta 的 LLaMA 这样的模型——对吧?如果我问你这些模型的驱动力是什么?答案几乎总是相同的——GPU 。昂贵、耗电的 GPU,通常都来自一家公司:NVIDIA。 icon
  • 以下是 Google AI Studio 最新升级和新的 Gemini 2.5 Flash 模型 API 的亮点: Google AI Studio 升级亮点:新增 Starter Apps: 一个重要的新增功能是 icon
  • 我们搞了个AI模型"闪电启动器",让大模型像Windows休眠功能一样秒开秒关! 以前跑AI大模型特别麻烦——每次用都要重新加载,像开电脑等系统启动一样慢,而且显卡内存根本塞不下几个模型。现在我们搞出了新方法,2-5秒就能唤醒一个AI(130亿到650亿参 icon
  • 现在AI发展得特别火对吧?但有个挺吓人的事儿——咱到现在都不知道该怎么判断这些AI到底有多聪明、多有创意或者多会共情。为啥呢?因为现在用的测试方法全是照着人类标准设计的,本来就不适合测AI。 最近我们还发现,就算改改题目的说法,AI的考试成绩都能差 icon
  • 微软研究人员表示,他们已经开发出一种可在 CPU 上运行的超高效 AI 模型 微软的研究人员说,他们造出了目前为止最大的“1比特”人工智能模型,这个模型也叫“bitnet”。 这个模型叫 BitNet b icon
  • OpenAI首席科学家Ilya Sutskever曾经打过一个比方:为什么让AI预测下一个词就能练出智能?这就好比看侦探小说——如果你能根据前面的线索推理出最后一页的凶手是谁,那才叫真正读懂了故事。️‍♂️ 受这个启发,我们决定用《逆转裁判》游戏来测试AI icon
  • 随着训练数据增加,模型量化需更高精度(如2位→3位)。8位通常够用,但长训练可能饱和。微软Bitnet模型理论高效(低比特硬件优势),但缺乏支持,训练成本高。谷歌Ge icon
  • OpenAI 今天发布了 OpenAI  o3 和 o4-mini, 这是最新的 o 系列模型,经过训练后,可以在做出反应前进行更长时间的思考。这是他们迄今为止发布的最智能的模型,代表着 ChatGPT 功能的一次重大飞跃,适用于从好奇的用户到高级研究人员的所有人。  icon
  • OpenAI最新提示指南中有两点挺有意思的,用大白话翻译就是:如果你要输入很长的内容,记得把你的要求(指令)在开头和结尾各写一遍要是你觉得麻烦不想写两遍,那至少要把你的要求放在最开头 icon
  • OpenAI即将推出的推理模型。推文提到: OpenAI的新安全博客表示,其模型即将能够创造新的科学。 有报道称,OpenAI的新推理模型可以在不同领域的概念之间建立联系,以建议新的实验类型。 OpenAI的首席财务官(CFO)几天前表示,使用其模型的科学家可能已经能 icon
  • Marginal Revolution 是一个知名的经济学博客,由乔治梅森大学的经济学教授泰勒·考恩(Tyler Cowen) 和 Alex Tabarrok 共同创立。 泰勒·考恩还撰写了多本书籍,涉及经济学、全球化、创新和文化等多个领域。他的著 icon