• OpenAI专家卢卡什·凯泽预言,AI将快速接管多数电脑端任务,算力与算法双重突破将引发能力陡升,人类需立即准备与AI协同进化。 未来几年,你每天在电脑前做的那些事——点点鼠标、写写邮件、敲敲代码,甚至做做PPT——可能都不需要你亲自动手了?这不是科幻电影
  • PyTorch推出Monarch框架,通过单控制器模型和网格抽象,让分布式AI训练像写本地Python一样简单,支持强化学习、容错预训练和交互式调试。 PyTorch Monarch震撼登场!单控制器编程模型彻底颠覆分布式AI训练方式,从此写分布式 icon
  • DeepSeek OCR光学压缩技术让AI训练数据暴涨、智能体记忆永续、RAG或将淘汰,实时多模态AI从此经济可行!第一章:这不是升级,这是AI的“JPEG时刻” 朋友们,听好了!我们现在正站在AI icon
  • DeepSeek通过创新视觉压缩技术,实现10倍于文本的上下文压缩率,有望将LLM上下文扩展至千万级token,彻底改变AI记忆与推理方式。 最近,深度求索(DeepSeek)发布了一篇堪称“颠覆性”的新论文,表面上看,他们只是推出了一个叫“DeepSee icon
  • 深度求索发布 DeepSeek-OCR,通过将文本渲染为图像并利用视觉编码器压缩,实现10倍于传统文本的压缩效率,为长上下文处理提供新思路。 你绝对想不到,文本居然能靠“变成图片”被大模型更高效地压缩!最近,国产大模型明星团队深度求索(DeepSeek)突 icon
  • Anthropic推出Claude Life Sciences,专为科研人员打造,用AI大幅提升生命科学研究效率,加速药物发现与生物数据分析。第一章:AI界“卷王”出手了!Claude不再只陪你聊天,它要帮你搞科研! icon
  • Karpathy直言当前大模型只是“聪明的复读机”,缺乏记忆、推理与真正的智能,十年内难有质变。【开篇:当AI教父亲手戳破泡沫】 朋友们,今天咱们不聊涨停板,不讲K线图,也不分析苹果供应链——咱们聊 icon
  • DeepSeek 所谓“OCR”实为文本压缩实验,通过图像输入绕过长上下文限制,技术不新但思路前瞻,或为 V4 多模态架构探路。 DeepSeek OCR这篇论文根本不是在做传统 OCR!别被名字骗了。它真正的野心,是把整页文档变成一张图,然后让大模型直接 icon
  • Glyph实现3–4倍上下文压缩且无性能损失,显著降低infilling成本;结合BLT分词与子智能体架构,有望重塑高效智能体工作流。 就在DeepSeek OCR发布的同一天,另一项技术Glyph横空出世,直接甩出王炸——不仅实现了3到4倍的上下文压缩率 icon
  • 谷歌DeepMind提出“新词学习”法,通过为大模型添加新词实现精准控制,并发现模型能自我解释词义,甚至创造出人类无法理解的“机器专属同义词”。 大模型其实也能“造词”?而且这个词还能精准控制它输出的内容?这是 icon
  • 哥本哈根大学2023年提出PIXEL模型,将文本渲染为图像进行语言建模,无需词表即可跨语言迁移,对非拉丁文字和噪声文本表现卓越,为视觉化语言处理开辟新路径。 虽然“DeepSeek-OCR”是首次把文字当图像来处理的AI模型,这是落地为实物了,但是在文字符 icon
  • Meta FAIR提出稀疏记忆微调法,通过仅更新与新知识高度相关且在预训练中少用的记忆槽,实现高效学习新事实同时大幅缓解灾难性遗忘,但其本质仍属记忆增强,距离真正意义上的技能持续学习尚有距离。 Meta新研究炸裂!AI终于能“边学边记”不忘本,但别 icon
  • 本文系统综述大语言模型如何重塑知识图谱构建全流程,涵盖本体工程、知识抽取与融合三大环节,揭示从静态规则到动态生成的范式跃迁,并展望多模态、可推理、自进化的知识系统未来。 最近,一篇来自西安电子科技大学的重磅综述论文《大语言模型赋能的知识图谱构建:综 icon
  • 贝克团队利用进化数据与AI模型RoseTTAFold2-PPI,高精度预测近3万对人类蛋白质相互作用,揭示数千新互作与疾病机制,并生成3D结构模型,为构建全人类3D互作组奠定基础。 人体里那两万多个蛋白质,到底是怎么“搭伙干活”的?它们可不是单打独 icon
  • 卡帕西通过合成任务与精细token控制,教会微型模型nanochat精准数出“strawberry”中的字母r,揭示小模型能力注入的核心工程方法。 一个只有蜜蜂大脑大小的小模型,居然也能学会“数草莓英文strawberry里有几个r”?听起来是不是有点魔幻 icon
  • 科学家训练出首个能生成全新DNA启动子的GPT模型,通过k-mer分词与轻量Transformer,生成序列具备真实生物学特征,为合成生物学开辟新路径。 DNA真的是一种语言?不是比喻,而是实实在在的语言——由A、T、G、C四个字母组成的“生命之书 icon
  • RL环境本质是包含环境、起始状态与验证器的标准化编程考场,确保AI能力评估公平可测,推动AI从聊天走向真实工程实践。 强化学习(RL)里的“环境”到底是什么!别被那些术语吓到,其实它根本没那么玄乎,说白了,就是一个超级公平、超级严格的“AI编程模拟考场”! icon