Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
芯片半导体
华为诺亚盘古大模型研发历程的心酸与黑暗
来自华为github帖子,原文点击标题:各位好,我是一名盘古大模型团队,华为诺亚方舟实验室的员工。 首先为自证身份,列举一些细节: 现诺亚主任,前算法应用部部长,后改名为小模型实验室的主任王云鹤。前诺亚主任:姚骏(大家称姚老
华为盘古 Pro MoE:专为昇腾芯片优化的AI模型
盘古Pro MoE是专门为昇腾300I双胞胎和800I A2特调优化! 盘古Pro MoE是华为于2025年5月28日发布的大语言模型,其基于创新的分组混合专家模型(Mixture of Grouped Experts, MoGE) 架构,在专家选
OpenAI豪掷100亿美元押注Cerebras,只为让ChatGPT快到飞起!
OpenAI与Cerebras达成三年超750兆瓦算力采购协议,价值超100亿美元,旨在突破Nvidia GPU瓶颈,实现推理速度5至20倍跃升,不仅优化用户体验,更可能支撑新一代长时自主编码AI系统。 ChatGPT如今每周服务9亿用户,背后是海
Google TPU v8抛弃HBM转向光子内存池架构
Google正在酝酿一场AI芯片架构的核爆级革命,计划在TPU v8世代彻底抛弃HBM高带宽内存,转向基于光子互连的外部DRAM内存池架构。 这场变革源于HBM全球产能危机,Google选择用光路交换技术(OCS)和类CXL协议构建三层解耦架构,将单TPU
AMD用DeepSeek小工具打造推理引擎ATOM:实现MI355X赶超英伟达B200
AMD基于DeepSeek工程师开源的nano-vLLM,打造专属推理引擎ATOM,针对MI355X显卡和DeepSeek、Qwen、Llama等模型深度优化,在中高并发场景下吞吐量超越NVIDIA Blackwell B200,尤其在DeepSeek-R1上实现1.4倍性能提升。
高带宽内存HBM比普通内存贵的理由正是AI的压舱石
HBM和普通DDR本质同源,但因TSV、超薄晶圆、三维堆叠和先进封装,单位容量更费硅、更难造、良率更低、周期更长,最终形成长期稀缺和高价。 HBM并不是“更先进的内存工艺”,而是“把普通DRAM拖进三维立体施工现场”的产物。晶体管没变魔法,内存单元没觉醒,
Rust标准库直接能在GPU上运行了
VectorWare公司成功让Rust标准库在GPU上运行,通过创新的“主机调用”机制,让显卡代码也能使用文件、网络、时间等系统功能,极大提升了GPU编程的便利性和代码复用能力。 以前咱们总觉得GPU(就是显卡里那个干重活的处理器)像个只会埋头算数
片上存储颠覆GPU瓶颈,Cerebras让大模型推理速度十倍飞跃
Cerebras通过将整个大模型存储在片上消除GPU显存带宽瓶颈,使推理速度从几百tokens每秒提升至两千五百以上,同时降低成本并提升模型智能,开启实时推理新纪元。 大模型推理速度的真正瓶颈不在算力,而在显存带宽。Cerebras通过晶圆级引擎将
新本地小模型Phi-4-mini-flash-reasoning发布
Phi-4-mini-flash-reasoning 是一个基于合成数据的轻量级开放模型,专注于高质量、推理密集的数据,并进一步优化以实现更高级的数学推理能力。该模型属于 Phi-4 模型系列,支持 64K 的 token 上下文长度。 Phi-4
韩国内存之父金俊昊预言HBM时代终结!闪迪将大涨
韩国内存之父金俊昊预言HBM时代终结,HBF闪存2027年颠覆AI算力格局,三星SK海力士血战,英伟达或将吞并存储厂重塑行业!韩国科学技术院(KAIST)的金俊昊教授——对,就是韩国官方认证的“HBM之父”——在YouTube上放狠话:“GPU霸权要崩了,内存才是AI新财阀!
从做梦到真香!1500刀搞定64G显存AI神机
【超详细装机小白历险记】从做梦到真香!1500刀搞定64G显存AI神机! (前情提要:一个被Mac耽误的装机小白觉醒之路) "等哪天有空了我也要组台电脑!"——这话我喊了十年,结果手里的MacBook都熬
谷歌TPU和AMD GPU谁才是AI加速器的真·王者?
谷歌TPU与AMD GPU本质分野:一边是编译器驱动的专用大脑,一边是可塑形的通用算力怪兽 谷歌TPU与AMD GPU在硬件目标、软件路径、规模化方式与运维控制层面呈现清晰分工。一个围绕编译与平台整体协同推进深度学习效率,一个围绕通用并行计算与开放生态扩展
AMD显卡的逆天外挂!ZLUDA让CUDA不再垄断
【科技八卦速递】给AMD显卡"打鸡血"的神器ZLUDA又有新搞头啦!两位程序猿大佬现在全职在搞事情,连老游戏物理引擎和AI模型都要拿下! 还记得那个能让AMD显卡偷跑Nvidia专属CUDA程序的"外挂"吗?去年差点凉凉,结果被神秘金主爸爸救活了!
OpenAI不满英伟达芯片推理速度,寻求AMD、Cerebras等替代方案!
OpenAI这个ChatGPT的缔造者,正在对英伟达的部分AI芯片表达不满,这种不满从2024年就开始酝酿,现在已经演变成一场轰轰烈烈的"芯片选美大赛"。 OpenAI把目光投向了AMD、Cerebras和Groq这些英伟达的竞争对手,试图在AI推理芯片这
32GB显卡:Blackhole硬刚RTX5090 MI60成黑马
今天咱们来唠唠显卡界的"三国杀"——Blackhole、RTX 5090和MI60这三张32GB显存显卡怎么选!(粉笔头砸中打瞌睡的小明) 首先看MI60这个"经济适用男"(PPT放出淘宝价截图),便宜是真便宜,但软件支持烂得像你爸单位的老电脑,动不动就蓝
甲骨文转型数据中心:从DB霸主到AI基建狂魔
甲骨文这家老牌软件公司,最近在云计算赛道突然开挂,尤其是AI数据中心业务像坐火箭一样飙升! 第一幕:甲骨文的"星际基地"与德州大本营 同学们想象一下:甲骨文在德州阿比林搞了个比科幻片还夸张的"星际之门"
4焦耳驱动1,000Gbps:硅光子提升数据中心效率
炸裂级大发现! 一根头发丝那么细的硅片,现在能把数据像开挂一样每秒狂飙 1000 千兆位(1000 Gbps),却只喝 4 口“电可乐”(4 焦耳)。相当于 7 分钟就能把 1 亿本书全塞进快递箱里! 说人话: 以前的数据中心像超市排队
英伟达迷你超算DGX Spark正式开售4000美元
英伟达"掌上超算"DGX Spark本月上市!4000美元让你把AI核弹带回家 英伟达悄悄憋了个大招——巴掌大的"迷你超算"DGX Spark要开卖了!这玩意儿虽然长得像你家路由器,但AI算力堪比科幻电影里的黑科技。
上页
下页