• 来自华为github帖子,原文点击标题:各位好,我是一名盘古大模型团队,华为诺亚方舟实验室的员工。 首先为自证身份,列举一些细节: 现诺亚主任,前算法应用部部长,后改名为小模型实验室的主任王云鹤。前诺亚主任:姚骏(大家称姚老
  • 盘古Pro MoE是专门为昇腾300I双胞胎和800I A2特调优化! 盘古Pro MoE是华为于2025年5月28日发布的大语言模型,其基于创新的分组混合专家模型(Mixture of Grouped Experts, MoGE) 架构,在专家选
  • OpenAI与Cerebras达成三年超750兆瓦算力采购协议,价值超100亿美元,旨在突破Nvidia GPU瓶颈,实现推理速度5至20倍跃升,不仅优化用户体验,更可能支撑新一代长时自主编码AI系统。 ChatGPT如今每周服务9亿用户,背后是海 icon
  • Google正在酝酿一场AI芯片架构的核爆级革命,计划在TPU v8世代彻底抛弃HBM高带宽内存,转向基于光子互连的外部DRAM内存池架构。 这场变革源于HBM全球产能危机,Google选择用光路交换技术(OCS)和类CXL协议构建三层解耦架构,将单TPU icon
  • AMD基于DeepSeek工程师开源的nano-vLLM,打造专属推理引擎ATOM,针对MI355X显卡和DeepSeek、Qwen、Llama等模型深度优化,在中高并发场景下吞吐量超越NVIDIA Blackwell B200,尤其在DeepSeek-R1上实现1.4倍性能提升。 icon
  • HBM和普通DDR本质同源,但因TSV、超薄晶圆、三维堆叠和先进封装,单位容量更费硅、更难造、良率更低、周期更长,最终形成长期稀缺和高价。 HBM并不是“更先进的内存工艺”,而是“把普通DRAM拖进三维立体施工现场”的产物。晶体管没变魔法,内存单元没觉醒, icon
  • VectorWare公司成功让Rust标准库在GPU上运行,通过创新的“主机调用”机制,让显卡代码也能使用文件、网络、时间等系统功能,极大提升了GPU编程的便利性和代码复用能力。 以前咱们总觉得GPU(就是显卡里那个干重活的处理器)像个只会埋头算数 icon
  • Cerebras通过将整个大模型存储在片上消除GPU显存带宽瓶颈,使推理速度从几百tokens每秒提升至两千五百以上,同时降低成本并提升模型智能,开启实时推理新纪元。 大模型推理速度的真正瓶颈不在算力,而在显存带宽。Cerebras通过晶圆级引擎将 icon
  • Phi-4-mini-flash-reasoning 是一个基于合成数据的轻量级开放模型,专注于高质量、推理密集的数据,并进一步优化以实现更高级的数学推理能力。该模型属于 Phi-4 模型系列,支持 64K 的 token 上下文长度。 Phi-4 icon
  • 韩国内存之父金俊昊预言HBM时代终结,HBF闪存2027年颠覆AI算力格局,三星SK海力士血战,英伟达或将吞并存储厂重塑行业!韩国科学技术院(KAIST)的金俊昊教授——对,就是韩国官方认证的“HBM之父”——在YouTube上放狠话:“GPU霸权要崩了,内存才是AI新财阀! icon
  • 【超详细装机小白历险记】从做梦到真香!1500刀搞定64G显存AI神机! (前情提要:一个被Mac耽误的装机小白觉醒之路) "等哪天有空了我也要组台电脑!"——这话我喊了十年,结果手里的MacBook都熬 icon
  • 谷歌TPU与AMD GPU本质分野:一边是编译器驱动的专用大脑,一边是可塑形的通用算力怪兽 谷歌TPU与AMD GPU在硬件目标、软件路径、规模化方式与运维控制层面呈现清晰分工。一个围绕编译与平台整体协同推进深度学习效率,一个围绕通用并行计算与开放生态扩展 icon
  • 【科技八卦速递】给AMD显卡"打鸡血"的神器ZLUDA又有新搞头啦!两位程序猿大佬现在全职在搞事情,连老游戏物理引擎和AI模型都要拿下! 还记得那个能让AMD显卡偷跑Nvidia专属CUDA程序的"外挂"吗?去年差点凉凉,结果被神秘金主爸爸救活了! icon
  • OpenAI这个ChatGPT的缔造者,正在对英伟达的部分AI芯片表达不满,这种不满从2024年就开始酝酿,现在已经演变成一场轰轰烈烈的"芯片选美大赛"。 OpenAI把目光投向了AMD、Cerebras和Groq这些英伟达的竞争对手,试图在AI推理芯片这 icon
  • 今天咱们来唠唠显卡界的"三国杀"——Blackhole、RTX 5090和MI60这三张32GB显存显卡怎么选!(粉笔头砸中打瞌睡的小明) 首先看MI60这个"经济适用男"(PPT放出淘宝价截图),便宜是真便宜,但软件支持烂得像你爸单位的老电脑,动不动就蓝 icon
  • 甲骨文这家老牌软件公司,最近在云计算赛道突然开挂,尤其是AI数据中心业务像坐火箭一样飙升! 第一幕:甲骨文的"星际基地"与德州大本营 同学们想象一下:甲骨文在德州阿比林搞了个比科幻片还夸张的"星际之门" icon
  • 炸裂级大发现!  一根头发丝那么细的硅片,现在能把数据像开挂一样每秒狂飙 1000 千兆位(1000 Gbps),却只喝 4 口“电可乐”(4 焦耳)。相当于 7 分钟就能把 1 亿本书全塞进快递箱里! 说人话:  以前的数据中心像超市排队 icon
  • 英伟达"掌上超算"DGX Spark本月上市!4000美元让你把AI核弹带回家   英伟达悄悄憋了个大招——巴掌大的"迷你超算"DGX Spark要开卖了!这玩意儿虽然长得像你家路由器,但AI算力堪比科幻电影里的黑科技。 icon