• 这些家伙真的把Transformer架构烧进了他们的芯片里。 为Transformer架构制造了世界上最快的芯片。 每秒50万个代币,Llama 70B吞吐量。 全球首款Transformer专用芯片(ASIC):SoHu One 8xSohu服务
  • DeepSeek员工刚刚开源了nano-vllm ,点击标题。 它是一个从头开始构建的轻量级vLLM实现。 关键特征 快速离线推理-与vLLM的推理速度相当 易读的代码库-在约1,
  • 该文认为大模型应该理解语义,不能只玩语法游戏,其实语法也是一种形式抽象! 原文:大型语言模型 (LLM),例如 GPT-4 及其后续版本,并不理解语言。它们不推理,不拥有信念,也不执行逻辑。 然而 icon
  • 三个数学方程公式揭示从宇宙能量到AI大脑的终极奥秘,最牛逼的是把上下文注意力计算公式与爱因斯坦相对论并列! icon
  • 很多人觉得AI瞎扯,其实你问得不对,问AI是有技巧的,之前称为提示,现在建议:你要告诉它更多上下文背景,然后再问你要答案的问题。 什么上下文背景 :就是各种铺垫 前因后果 你为啥问这个问题,你想要的答案希望是啥?反正掏心掏肺多说点。不要像对人暗示那 icon
  • AI其实是个“找漏困难户”? 来自《AbsenceBench:语言模型无法告诉我们缺少了什么》点击标题 核心问题:现在的AI(比如ChatGPT、Claude这些大模型)特别擅长从一堆信息里“找东西”——比如让你在一篇超长的文章里定位某个关键词,它 icon
  • K2 甚至比 DeepSeek v3 更强大,可以与 Claude Opus 4 和 GPT-4.1 相媲美! Kimi K2是一个最先进的混合专家(MOE)语言模型,拥有320亿个激活参数和1万亿个总参数。经过Muon优化器的训练,Kimi K2 icon
  • 这个(点击标题)轻量级框架将 Claude Code变成了一个完整的开发伙伴 - 基于 git 的检查点记忆 - 9 个代理角色(即架构师、前端、安全) - 始终检查官方文档 - 从不猜测 - 为您编写文档 - 令牌使用效率提高 70% icon
  • Grok 4狂暴升级!数学满分+语音超丝滑!AI新王登基!跑分全第一+ xAI公司开发的Grok 4人工智能模型在“Humanity's Last Exam”(HLE,人类终极考试)这一基准测试中取得了超过50%的得分 icon
  • DeepSeek-r1-0528在新的SciArena基准测试中排名前5,是唯一的开源AI。当AI学霸们组团搞科研,谁才是文献界的"最强王者"?现在的科学论文就像春天的竹笋一样"蹭蹭"往外冒,教授们看文献看得头都大了!这时候, icon
  • 我是你们的老朋友Dex!最近我可沉迷研究AI智能体了,就跟你们追番剧一样上头!(突然掏出一堆玩具)看!这些AI框架我都玩遍啦—— 有像乐高一样即插即用的crew/langchains(咣当组装),有号称"极简主义"的smolagents(捏着兰花指 icon
  • AI 智能体:不只是会“聊天”,还要学会“思考”和“行动” 现在的 AI 可不只是会陪你聊天、写作文那么简单了。那些酷炫的 AI 公司,为了让 AI 变得更聪明、更靠谱,不再仅仅满足于让 AI “预测下一个词”。它们正在努力让 AI 变成真正的“< icon
  • 人工智能能当老板吗?——大语言模型在管理能力上的表现作者:戴夫·赫尔伯特使用模型:Gemini 2.5 Pro、Claude Sonnet 4、GPT-4.5 我们搞了个"CEO能力测试",专门看看现在这些人工智能(AI)当老板靠不靠谱。测 icon
  • 这个测试就像给AI大脑们做"纽约时报联想游戏"大考!原版有436道联想题,现在升级到651道超级加量版。题目规则是给你16个词,要分成4组"心有灵犀"的词(比如"篮球、足球、网球、羽毛球"都算球类运动)。但为了难倒AI,我们使了个坏——往每道题里偷偷塞进最多4个"捣蛋鬼词汇"(比如在一堆体育 icon
  • # 大语言模型能玩好文字游戏吗?  ——当前最强AI的现状与未解之谜   作者:一群来自芝加哥大学、雪城大学、米尔本高中等学校的学霸们   简单来 icon
  • 你们有没有玩过一种叫做奥赛罗(Othello)的棋类游戏?就是那种黑白棋,翻来翻去把对方的棋子变成自己的颜色,最后看谁的棋子多。 现在,哥本哈根大学的科学家们,就像一群好奇宝宝,正在重新研究一个酷炫的假设,叫做 icon
  • 这篇四年前论文研究发现:用文本预训练好的Transformer模型,居然也能直接用来处理图片、蛋白质数据甚至数学运算... 这就像你家的微波炉说明书,突然发现还能当游戏机攻略用! 论文里提出的"万能计算引擎"这个概念特别形象——Transform icon
  • Grok 4 来了,编程能力要“爆表”? 这个最新的版本将会被命名为 Grok 4。别急,它很快就会和大家见面了,预计就在 7月4日国庆节(美国独立日)刚过 就会发布! icon