Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
大语言模型LLM
OpenAI卢卡什·凯泽预言:算力算法双重带来AI能力陡峭上升
OpenAI专家卢卡什·凯泽预言,AI将快速接管多数电脑端任务,算力与算法双重突破将引发能力陡升,人类需立即准备与AI协同进化。 未来几年,你每天在电脑前做的那些事——点点鼠标、写写邮件、敲敲代码,甚至做做PPT——可能都不需要你亲自动手了?这不是科幻电影
阿里云发布Aegaeon调度系统:吞吐提9倍、推理GPU用量减82%
阿里云发布Aegaeon调度系统,通过GPU虚拟化与token级调度,实现推理GPU用量减少82%、有效吞吐提升9倍,为受限市场提供高效AI推理新路径。 阿里云放大招!新调度系统让英伟达GPU用量暴降82%,推理效率飙升9倍!
PyTorch推出Monarch框架:分布式AI训练像写本地Python一样简单
PyTorch推出Monarch框架,通过单控制器模型和网格抽象,让分布式AI训练像写本地Python一样简单,支持强化学习、容错预训练和交互式调试。 PyTorch Monarch震撼登场!单控制器编程模型彻底颠覆分布式AI训练方式,从此写分布式
DeepSeek光学压缩引发JPG时刻:记忆不再遗忘 训练不再受限
DeepSeek OCR光学压缩技术让AI训练数据暴涨、智能体记忆永续、RAG或将淘汰,实时多模态AI从此经济可行!第一章:这不是升级,这是AI的“JPEG时刻” 朋友们,听好了!我们现在正站在AI
DeepSeek-OCR视觉压缩革命:上下文或突破千万token
DeepSeek通过创新视觉压缩技术,实现10倍于文本的上下文压缩率,有望将LLM上下文扩展至千万级token,彻底改变AI记忆与推理方式。 最近,深度求索(DeepSeek)发布了一篇堪称“颠覆性”的新论文,表面上看,他们只是推出了一个叫“DeepSee
DeepSeek-OCR压缩效率暴增10倍!国产大模型杀出新赛道
深度求索发布 DeepSeek-OCR,通过将文本渲染为图像并利用视觉编码器压缩,实现10倍于传统文本的压缩效率,为长上下文处理提供新思路。 你绝对想不到,文本居然能靠“变成图片”被大模型更高效地压缩!最近,国产大模型明星团队深度求索(DeepSeek)突
Claude强势杀入生命科学,将科学家从重复劳动中彻底解放
Anthropic推出Claude Life Sciences,专为科研人员打造,用AI大幅提升生命科学研究效率,加速药物发现与生物数据分析。第一章:AI界“卷王”出手了!Claude不再只陪你聊天,它要帮你搞科研!
如果连Karpathy都这么说,AI泡沫真该炸了!
Karpathy直言当前大模型只是“聪明的复读机”,缺乏记忆、推理与真正的智能,十年内难有质变。【开篇:当AI教父亲手戳破泡沫】 朋友们,今天咱们不聊涨停板,不讲K线图,也不分析苹果供应链——咱们聊
DeepSeek OCR实为一种用图像压缩文本上下文的大胆实验
DeepSeek 所谓“OCR”实为文本压缩实验,通过图像输入绕过长上下文限制,技术不新但思路前瞻,或为 V4 多模态架构探路。 DeepSeek OCR这篇论文根本不是在做传统 OCR!别被名字骗了。它真正的野心,是把整页文档变成一张图,然后让大模型直接
上下文压缩3倍!Glyph让大模型推理成本断崖式下降
Glyph实现3–4倍上下文压缩且无性能损失,显著降低infilling成本;结合BLT分词与子智能体架构,有望重塑高效智能体工作流。 就在DeepSeek OCR发布的同一天,另一项技术Glyph横空出世,直接甩出王炸——不仅实现了3到4倍的上下文压缩率
谷歌DeepMind提出新词学习法:AI已拥有独立于人类的语义世界!
谷歌DeepMind提出“新词学习”法,通过为大模型添加新词实现精准控制,并发现模型能自我解释词义,甚至创造出人类无法理解的“机器专属同义词”。 大模型其实也能“造词”?而且这个词还能精准控制它输出的内容?这是
哥大2023年PIXEL模型:将文本渲染为图像实现语言建模
哥本哈根大学2023年提出PIXEL模型,将文本渲染为图像进行语言建模,无需词表即可跨语言迁移,对非拉丁文字和噪声文本表现卓越,为视觉化语言处理开辟新路径。 虽然“DeepSeek-OCR”是首次把文字当图像来处理的AI模型,这是落地为实物了,但是在文字符
Meta稀疏记忆微调法用记笔记实现持续学习
Meta FAIR提出稀疏记忆微调法,通过仅更新与新知识高度相关且在预训练中少用的记忆槽,实现高效学习新事实同时大幅缓解灾难性遗忘,但其本质仍属记忆增强,距离真正意义上的技能持续学习尚有距离。 Meta新研究炸裂!AI终于能“边学边记”不忘本,但别
大语言模型重塑知识图谱构建的三个方向
本文系统综述大语言模型如何重塑知识图谱构建全流程,涵盖本体工程、知识抽取与融合三大环节,揭示从静态规则到动态生成的范式跃迁,并展望多模态、可推理、自进化的知识系统未来。 最近,一篇来自西安电子科技大学的重磅综述论文《大语言模型赋能的知识图谱构建:综
AI高精度预测3600个全新蛋白互动,4950种疾病机制浮出水面!
贝克团队利用进化数据与AI模型RoseTTAFold2-PPI,高精度预测近3万对人类蛋白质相互作用,揭示数千新互作与疾病机制,并生成3D结构模型,为构建全人类3D互作组奠定基础。 人体里那两万多个蛋白质,到底是怎么“搭伙干活”的?它们可不是单打独
AI大神卡帕西教你辅导小模型学数数!像极了辅导熊孩子功课
卡帕西通过合成任务与精细token控制,教会微型模型nanochat精准数出“strawberry”中的字母r,揭示小模型能力注入的核心工程方法。 一个只有蜜蜂大脑大小的小模型,居然也能学会“数草莓英文strawberry里有几个r”?听起来是不是有点魔幻
全球首个DNA语言模型诞生:GPT式AI设计出具备真实功能的新启动子
科学家训练出首个能生成全新DNA启动子的GPT模型,通过k-mer分词与轻量Transformer,生成序列具备真实生物学特征,为合成生物学开辟新路径。 DNA真的是一种语言?不是比喻,而是实实在在的语言——由A、T、G、C四个字母组成的“生命之书
揭秘强化学习背后那个决定生死的“虚拟考场”!
RL环境本质是包含环境、起始状态与验证器的标准化编程考场,确保AI能力评估公平可测,推动AI从聊天走向真实工程实践。 强化学习(RL)里的“环境”到底是什么!别被那些术语吓到,其实它根本没那么玄乎,说白了,就是一个超级公平、超级严格的“AI编程模拟考场”!
上页
下页
关闭