大语言模型LLM

OpenAI卢卡什·凯泽预言：算力算法双重带来AI能力陡峭上升

OpenAI专家卢卡什·凯泽预言，AI将快速接管多数电脑端任务，算力与算法双重突破将引发能力陡升，人类需立即准备与AI协同进化。未来几年，你每天在电脑前做的那些事——点点鼠标、写写邮件、敲敲代码，甚至做做PPT——可能都不需要你亲自动手了？这不是科幻电影

阿里云发布Aegaeon调度系统：吞吐提9倍、推理GPU用量减82%

阿里云发布Aegaeon调度系统，通过GPU虚拟化与token级调度，实现推理GPU用量减少82%、有效吞吐提升9倍，为受限市场提供高效AI推理新路径。阿里云放大招！新调度系统让英伟达GPU用量暴降82%，推理效率飙升9倍！

PyTorch推出Monarch框架：分布式AI训练像写本地Python一样简单

PyTorch推出Monarch框架，通过单控制器模型和网格抽象，让分布式AI训练像写本地Python一样简单，支持强化学习、容错预训练和交互式调试。 PyTorch Monarch震撼登场！单控制器编程模型彻底颠覆分布式AI训练方式，从此写分布式

DeepSeek光学压缩引发JPG时刻：记忆不再遗忘训练不再受限

DeepSeek OCR光学压缩技术让AI训练数据暴涨、智能体记忆永续、RAG或将淘汰，实时多模态AI从此经济可行！第一章：这不是升级，这是AI的“JPEG时刻” 朋友们，听好了！我们现在正站在AI

DeepSeek-OCR视觉压缩革命：上下文或突破千万token

DeepSeek通过创新视觉压缩技术，实现10倍于文本的上下文压缩率，有望将LLM上下文扩展至千万级token，彻底改变AI记忆与推理方式。最近，深度求索（DeepSeek）发布了一篇堪称“颠覆性”的新论文，表面上看，他们只是推出了一个叫“DeepSee

DeepSeek-OCR压缩效率暴增10倍！国产大模型杀出新赛道

深度求索发布 DeepSeek-OCR，通过将文本渲染为图像并利用视觉编码器压缩，实现10倍于传统文本的压缩效率，为长上下文处理提供新思路。你绝对想不到，文本居然能靠“变成图片”被大模型更高效地压缩！最近，国产大模型明星团队深度求索（DeepSeek）突

Claude强势杀入生命科学，将科学家从重复劳动中彻底解放

Anthropic推出Claude Life Sciences，专为科研人员打造，用AI大幅提升生命科学研究效率，加速药物发现与生物数据分析。第一章：AI界“卷王”出手了！Claude不再只陪你聊天，它要帮你搞科研！

如果连Karpathy都这么说，AI泡沫真该炸了！

Karpathy直言当前大模型只是“聪明的复读机”，缺乏记忆、推理与真正的智能，十年内难有质变。【开篇：当AI教父亲手戳破泡沫】朋友们，今天咱们不聊涨停板，不讲K线图，也不分析苹果供应链——咱们聊

DeepSeek OCR实为一种用图像压缩文本上下文的大胆实验

DeepSeek 所谓“OCR”实为文本压缩实验，通过图像输入绕过长上下文限制，技术不新但思路前瞻，或为 V4 多模态架构探路。 DeepSeek OCR这篇论文根本不是在做传统 OCR！别被名字骗了。它真正的野心，是把整页文档变成一张图，然后让大模型直接

上下文压缩3倍！Glyph让大模型推理成本断崖式下降

Glyph实现3–4倍上下文压缩且无性能损失，显著降低infilling成本；结合BLT分词与子智能体架构，有望重塑高效智能体工作流。就在DeepSeek OCR发布的同一天，另一项技术Glyph横空出世，直接甩出王炸——不仅实现了3到4倍的上下文压缩率

谷歌DeepMind提出新词学习法：AI已拥有独立于人类的语义世界！

谷歌DeepMind提出“新词学习”法，通过为大模型添加新词实现精准控制，并发现模型能自我解释词义，甚至创造出人类无法理解的“机器专属同义词”。大模型其实也能“造词”？而且这个词还能精准控制它输出的内容？这是

哥大2023年PIXEL模型：将文本渲染为图像实现语言建模

哥本哈根大学2023年提出PIXEL模型，将文本渲染为图像进行语言建模，无需词表即可跨语言迁移，对非拉丁文字和噪声文本表现卓越，为视觉化语言处理开辟新路径。虽然“DeepSeek-OCR”是首次把文字当图像来处理的AI模型，这是落地为实物了，但是在文字符

Meta稀疏记忆微调法用记笔记实现持续学习

Meta FAIR提出稀疏记忆微调法，通过仅更新与新知识高度相关且在预训练中少用的记忆槽，实现高效学习新事实同时大幅缓解灾难性遗忘，但其本质仍属记忆增强，距离真正意义上的技能持续学习尚有距离。 Meta新研究炸裂！AI终于能“边学边记”不忘本，但别

大语言模型重塑知识图谱构建的三个方向

本文系统综述大语言模型如何重塑知识图谱构建全流程，涵盖本体工程、知识抽取与融合三大环节，揭示从静态规则到动态生成的范式跃迁，并展望多模态、可推理、自进化的知识系统未来。最近，一篇来自西安电子科技大学的重磅综述论文《大语言模型赋能的知识图谱构建：综

AI高精度预测3600个全新蛋白互动，4950种疾病机制浮出水面！

贝克团队利用进化数据与AI模型RoseTTAFold2-PPI，高精度预测近3万对人类蛋白质相互作用，揭示数千新互作与疾病机制，并生成3D结构模型，为构建全人类3D互作组奠定基础。人体里那两万多个蛋白质，到底是怎么“搭伙干活”的？它们可不是单打独

AI大神卡帕西教你辅导小模型学数数！像极了辅导熊孩子功课

卡帕西通过合成任务与精细token控制，教会微型模型nanochat精准数出“strawberry”中的字母r，揭示小模型能力注入的核心工程方法。一个只有蜜蜂大脑大小的小模型，居然也能学会“数草莓英文strawberry里有几个r”？听起来是不是有点魔幻

全球首个DNA语言模型诞生：GPT式AI设计出具备真实功能的新启动子

科学家训练出首个能生成全新DNA启动子的GPT模型，通过k-mer分词与轻量Transformer，生成序列具备真实生物学特征，为合成生物学开辟新路径。 DNA真的是一种语言？不是比喻，而是实实在在的语言——由A、T、G、C四个字母组成的“生命之书

揭秘强化学习背后那个决定生死的“虚拟考场”！

RL环境本质是包含环境、起始状态与验证器的标准化编程考场，确保AI能力评估公平可测，推动AI从聊天走向真实工程实践。强化学习（RL）里的“环境”到底是什么！别被那些术语吓到，其实它根本没那么玄乎，说白了，就是一个超级公平、超级严格的“AI编程模拟考场”！