芯片半导体 - 第2页

Tile Kernels通过DSL与融合算子逼近硬件极限，同时削弱CUDA绑定，推动AI竞争从模型设计转向系统工程能力与跨硬件抽象。 DeepSeek发布开源Tile Kernels并不只是一次性能优化更新，这次动作直接把模型效率推进到硬件极限对齐

M5 Pro 和 M5 Max 是苹果公司为 MacBook Pro 推出的全新超强“大脑”。苹果公司将两颗先进的芯片（3nm工艺）合并成一颗，从而制造出了这种芯片：这就是融合架构。简而言之：

英伟达在GTC 2026推出完整物理AI生态，从DRIVE Hyperion自动驾驶平台到GR00T人形机器人模型，从数据工厂蓝图到5G边缘AI基础设施，用算力革命解决数据瓶颈，引领万亿级机器人产业变革。在GTC 2026上黄仁勋穿着他那件标志性的皮夹

在英伟达GTC 2026大会上，黄仁勋展示了AI产业从单纯卖芯片到构建全球AI基础设施的巨大转变。从Blackwell订单暴涨、Vera Rubin平台发布，到Groq LPU推理架构、DLSS 5渲染革命以及企业智能体生态，整个AI产业的底层格局正在重写。

英伟达GTC 2026或发布Rubin CPX与LPX异构推理芯片，分别针对Prefill计算与Decode内存带宽优化，采用SRAM架构与GDDR7分层内存，配合Dynamo软件重构AI基础设施格局。

英伟达即将三月发布全新芯片LPU：起源于英伟达以200亿美元收购Groq，这笔交易的关键不在于SRAM，而在于数据流架构（Dataflow Architecture），数据流架构为英伟达新芯片奠定了基础架构！很多人当初解读收购Groq是为了SRAM，其实

基于泄露信息深度剖析GPT-5.4的颠覆性升级。从像素级视觉到自主执行任务，再到2M token上下文和持久状态带来的硬件革命，解读为何这将是人工智能史上的真正代际飞跃，以及光学互联等硬件如何应对KV缓存爆炸。这么说吧，以前的人工智能，就像一个记忆力只有

别被CUDA骗了！英伟达赢华为的真正底牌是时间窗口！时间差决定胜负，系统能力放大时间差。英伟达靠时间领先和软件生态锁定优势，华为用整机交付和集群补偿追赶，胜负取决于谁更快完成系统闭环。时间差决定胜负，系统能力放大时间差<

文章从第一性原理出发解释Groq的compiler first架构与SRAM设计逻辑，并分析其与NVIDIA GPU+HBM体系的根本差异，进一步推演收购之后的系统级异构推理架构，以及SRAM与HBM在AI推理市场中的长期分工。英伟达发现一个超级简单

AI芯片战场迎来新玩家，MatX用5亿美元押注能同时驾驭高速缓存SRAM与大容量内存HBM的终极方案，目标直指英伟达霸主地位。想象一下你在玩游戏。电脑里其实有两个存东西的地方：第一个在CPU旁边，叫“口袋”SRAM。它的速度飞快，你伸手就

马斯克宣布七天内启动Terafab项目，目标建成全球最大2纳米芯片厂，但特斯拉零半导体制造经验、芯片团队流失殆尽，英伟达CEO黄仁勋警告此计划几乎不可能实现。特斯拉要建全世界最大的芯片工厂了，马斯克放话七天之内启动"Terafab Project"，要在

121 ExaFlops算力也救不了Gemini的死亡循环：谷歌第八代TPU芯片深度解析：121 ExaFlops算力怪兽背后的硬件野心与软件困局谷歌发布第八代TPU两款专用芯片TPU 8t和TPU 8i，训练芯片单个超级计算单元扩展至9600颗芯片、

谷歌向看似竞争对手的Anthropic投资400亿美元，本质是用现金和芯片换订单与股权，上演一场“投资你，然后你花钱租我服务器”的闭环游戏，背后是对算力霸权而非模型霸权的终极押注。这钱到底给不给得出门右转就回家

autokernel 是一个面向 GPU 开发者的开源工具，核心目标只有一件事：让 AI 自动优化 CUDA kernel（GPU底层算子），从而显著提升深度学习和高性能计算的运行速度。简单说一句人话：它想把“GPU算子优化工程师”这份高难度工作，交给 AI 自动完成。

芯片不再输给算力，开始输给封装结构！先进封装已经从后端组装变为系统性能核心变量。材料、工艺与热机械行为共同决定稳定量产能力。封装尺寸扩大、结构变薄、异构集成增强直接放大翘曲、应力和对准误差。行业进入多变量耦合阶段，每个优化都带来新代价。摩尔定律延续路径正从晶体管转向封装，但封装本身的极限已经

ROCprof Trace Decoder 是一个专门用于 AMD GPU 线程跟踪（thread trace）数据解码的插件库，它是 ROCm 生态中用于 GPU 性能分析的重要组件之一。 AMD开源rocprof-trace-decoder！

DoubleAI发布WarpSpeed系统，AI自主重写英伟达cuGraph全部GPU内核，平均提速3.6倍，100%算法获加速，开创人工专家智能新纪元，证明AI可在高推理深度领域超越人类顶尖工程师。当AI GPU工程师的饭碗：

Nordic Semiconductor 十倍股密码：从蓝牙小芯片到卫星物联网的逆袭之路，一个挪威小厂如何靠一颗nRF9151芯片征服太空边缘计算挪威有个芯片公司闷声发大财，它叫Nordic Semiconductor，主业是做低功耗无线连接芯片。这家公