Dojo
话题
新佳
订阅
极道
元认知
元逻辑
元设计
元编程
元语言
芯片半导体
GPT-5.4泄露:2M上下文+永久记忆=炸爆内存+光通信
基于泄露信息深度剖析GPT-5.4的颠覆性升级。从像素级视觉到自主执行任务,再到2M token上下文和持久状态带来的硬件革命,解读为何这将是人工智能史上的真正代际飞跃,以及光学互联等硬件如何应对KV缓存爆炸。 这么说吧,以前的人工智能,就像一个记忆力只有
英伟达GTC 2026新芯片预测:Rubin CPX与LPX解码芯片重构AI推理架构
英伟达GTC 2026或发布Rubin CPX与LPX异构推理芯片,分别针对Prefill计算与Decode内存带宽优化,采用SRAM架构与GDDR7分层内存,配合Dynamo软件重构AI基础设施格局。
英伟达新芯片LPU揭秘:数据流+高精度时钟+扩容暂存器+热设计优化
英伟达即将三月发布全新芯片LPU:起源于英伟达以200亿美元收购Groq,这笔交易的关键不在于SRAM,而在于数据流架构(Dataflow Architecture),数据流架构为英伟达新芯片奠定了基础架构! 很多人当初解读收购Groq是为了SRAM,其实
苹果M5 Pro Max融合架构深度解析:本地AI推理性能暴涨4倍
M5 Pro 和 M5 Max 是苹果公司为 MacBook Pro 推出的全新超强“大脑”。 苹果公司将两颗先进的芯片(3nm工艺)合并成一颗,从而制造出了这种芯片:这就是融合架构。 简而言之:
zclaw:嵌入式设备ESP32微控制器的OpenClaw
zclaw 是一个非常轻量级的 个人 AI 助手固件项目,目标是跑在 ESP32 这种微控制器 上,通过 Wi-Fi 网络做到人工智能对话、自动化控制(比如 GPIO 引脚)、任务调度(cron)、记忆存储等等。而且项目整体目标尺寸 非常小 —— 包括所有运行时、网络、加密支持等在内最终 f
Taalas硬编码芯片打爆英伟达H200:无HBM却快10倍省20倍钱
当整个行业都在烧钱建数据中心、囤GPU、搞液冷超算时,一家成立仅两年半的加拿大公司Taalas掏出了一块"硬编码"芯片,把Llama 3.1 8B模型的推理速度干到了每秒17000个token——比英伟达H200快将近10倍,成本只有二十分之一,功耗少了90%。他们没有HBM,没有先进封装,
5亿造SRAM+HBM推理芯片:MatX成本革命直击英伟达命门!
AI芯片战场迎来新玩家,MatX用5亿美元押注能同时驾驭高速缓存SRAM与大容量内存HBM的终极方案,目标直指英伟达霸主地位。 想象一下你在玩游戏。电脑里其实有两个存东西的地方:第一个在CPU旁边,叫“口袋”SRAM。它的速度飞快,你伸手就
AMD用DeepSeek小工具打造推理引擎ATOM:实现MI355X赶超英伟达B200
AMD基于DeepSeek工程师开源的nano-vLLM,打造专属推理引擎ATOM,针对MI355X显卡和DeepSeek、Qwen、Llama等模型深度优化,在中高并发场景下吞吐量超越NVIDIA Blackwell B200,尤其在DeepSeek-R1上实现1.4倍性能提升。
Google TPU v8抛弃HBM转向光子内存池架构
Google正在酝酿一场AI芯片架构的核爆级革命,计划在TPU v8世代彻底抛弃HBM高带宽内存,转向基于光子互连的外部DRAM内存池架构。 这场变革源于HBM全球产能危机,Google选择用光路交换技术(OCS)和类CXL协议构建三层解耦架构,将单TPU
英伟达Blackwell部署崩盘!OpenAI与Meta急等GB300救援
英伟达Nvidia的黑卡Blackwell芯片家族在2024年遭遇了长达一年的部署噩梦:OpenAI、Meta等顶级客户在购买价值数十亿美元的Grace Blackwell服务器后,发现这些系统存在严重过热和连接问题,导致大规模AI训练项目被迫延迟。Nvidia通过推出改进版GB300芯片、提供退款
SK海力士H³架构破解AI显存墙:HBM+HBF混合内存实现18倍批处理提升
SK海力士提出H³混合架构,结合HBM与高带宽闪存HBF,通过延迟隐藏缓冲区和菊花链连接,使LLM推理批处理提升18.8倍,能效提高2.69倍,并指出光互连是规模化关键。 万亿Token时代,内存不够?SK海力士把闪存焊上显存,还顺手给数据中心装了光缆!<
DoubleAI优化英伟达cuGraph内核3.6倍提速,秒杀十年专家功力!
DoubleAI发布WarpSpeed系统,AI自主重写英伟达cuGraph全部GPU内核,平均提速3.6倍,100%算法获加速,开创人工专家智能新纪元,证明AI可在高推理深度领域超越人类顶尖工程师。 当AI GPU工程师的饭碗:
一个挪威小厂Nordic靠一颗nRF9151芯片征服太空边缘计算
Nordic Semiconductor 十倍股密码:从蓝牙小芯片到卫星物联网的逆袭之路,一个挪威小厂如何靠一颗nRF9151芯片征服太空边缘计算 挪威有个芯片公司闷声发大财,它叫Nordic Semiconductor,主业是做低功耗无线连接芯片。这家公
AMD ROCm生态中GPU性能分析ROCprof Trace Decoder开源了
ROCprof Trace Decoder 是一个专门用于 AMD GPU 线程跟踪(thread trace) 数据解码的插件库,它是 ROCm 生态中用于 GPU 性能分析的重要组件之一。 AMD开源rocprof-trace-decoder!
韩国内存之父金俊昊预言HBM时代终结!闪迪将大涨
韩国内存之父金俊昊预言HBM时代终结,HBF闪存2027年颠覆AI算力格局,三星SK海力士血战,英伟达或将吞并存储厂重塑行业!韩国科学技术院(KAIST)的金俊昊教授——对,就是韩国官方认证的“HBM之父”——在YouTube上放狠话:“GPU霸权要崩了,内存才是AI新财阀!
OpenAI不满英伟达芯片推理速度,寻求AMD、Cerebras等替代方案!
OpenAI这个ChatGPT的缔造者,正在对英伟达的部分AI芯片表达不满,这种不满从2024年就开始酝酿,现在已经演变成一场轰轰烈烈的"芯片选美大赛"。 OpenAI把目光投向了AMD、Cerebras和Groq这些英伟达的竞争对手,试图在AI推理芯片这
谷歌TPU和AMD GPU谁才是AI加速器的真·王者?
谷歌TPU与AMD GPU本质分野:一边是编译器驱动的专用大脑,一边是可塑形的通用算力怪兽 谷歌TPU与AMD GPU在硬件目标、软件路径、规模化方式与运维控制层面呈现清晰分工。一个围绕编译与平台整体协同推进深度学习效率,一个围绕通用并行计算与开放生态扩展
GPU霸主英伟达竟然要造CPU:Meta狂砸500亿美元,智能体指引AI芯片!
GPU霸主英伟达突然杀进CPU战场,Meta豪掷500亿美元买单。这不是简单的"我也卖芯片",而是一场从GPU到CPU、从硬件到软件的全生态围猎。当竞争对手还在造"兼容配件",英伟达已经在修"高速公路"——一条只有自家车能跑的特权通道。商场里的奢侈品店终于盯上
下页
关闭