• zclaw 是一个非常轻量级的 个人 AI 助手固件项目,目标是跑在 ESP32 这种微控制器 上,通过 Wi-Fi 网络做到人工智能对话、自动化控制(比如 GPIO 引脚)、任务调度(cron)、记忆存储等等。而且项目整体目标尺寸 非常小 —— 包括所有运行时、网络、加密支持等在内最终 f
  • 当整个行业都在烧钱建数据中心、囤GPU、搞液冷超算时,一家成立仅两年半的加拿大公司Taalas掏出了一块"硬编码"芯片,把Llama 3.1 8B模型的推理速度干到了每秒17000个token——比英伟达H200快将近10倍,成本只有二十分之一,功耗少了90%。他们没有HBM,没有先进封装,
  • M5 Pro 和 M5 Max 是苹果公司为 MacBook Pro 推出的全新超强“大脑”。 苹果公司将两颗先进的芯片(3nm工艺)合并成一颗,从而制造出了这种芯片:这就是融合架构。 简而言之: icon
  • SK海力士提出H³混合架构,结合HBM与高带宽闪存HBF,通过延迟隐藏缓冲区和菊花链连接,使LLM推理批处理提升18.8倍,能效提高2.69倍,并指出光互连是规模化关键。 万亿Token时代,内存不够?SK海力士把闪存焊上显存,还顺手给数据中心装了光缆!< icon
  •  英伟达在GTC 2026推出完整物理AI生态,从DRIVE Hyperion自动驾驶平台到GR00T人形机器人模型,从数据工厂蓝图到5G边缘AI基础设施,用算力革命解决数据瓶颈,引领万亿级机器人产业变革。 在GTC 2026上黄仁勋穿着他那件标志性的皮夹 icon
  • 英伟达GTC 2026或发布Rubin CPX与LPX异构推理芯片,分别针对Prefill计算与Decode内存带宽优化,采用SRAM架构与GDDR7分层内存,配合Dynamo软件重构AI基础设施格局。 icon
  • 在英伟达GTC 2026大会上,黄仁勋展示了AI产业从单纯卖芯片到构建全球AI基础设施的巨大转变。从Blackwell订单暴涨、Vera Rubin平台发布,到Groq LPU推理架构、DLSS 5渲染革命以及企业智能体生态,整个AI产业的底层格局正在重写。 icon
  •   文章从第一性原理出发解释Groq的compiler first架构与SRAM设计逻辑,并分析其与NVIDIA GPU+HBM体系的根本差异,进一步推演收购之后的系统级异构推理架构,以及SRAM与HBM在AI推理市场中的长期分工。 英伟达发现一个超级简单 icon
  • 基于泄露信息深度剖析GPT-5.4的颠覆性升级。从像素级视觉到自主执行任务,再到2M token上下文和持久状态带来的硬件革命,解读为何这将是人工智能史上的真正代际飞跃,以及光学互联等硬件如何应对KV缓存爆炸。 这么说吧,以前的人工智能,就像一个记忆力只有 icon
  • AI芯片战场迎来新玩家,MatX用5亿美元押注能同时驾驭高速缓存SRAM与大容量内存HBM的终极方案,目标直指英伟达霸主地位。 想象一下你在玩游戏。电脑里其实有两个存东西的地方:第一个在CPU旁边,叫“口袋”SRAM。它的速度飞快,你伸手就 icon
  • 马斯克宣布七天内启动Terafab项目,目标建成全球最大2纳米芯片厂,但特斯拉零半导体制造经验、芯片团队流失殆尽,英伟达CEO黄仁勋警告此计划几乎不可能实现。 特斯拉要建全世界最大的芯片工厂了,马斯克放话七天之内启动"Terafab Project",要在 icon
  • 别被CUDA骗了!英伟达赢华为的真正底牌是时间窗口!时间差决定胜负,系统能力放大时间差。英伟达靠时间领先和软件生态锁定优势,华为用整机交付和集群补偿追赶,胜负取决于谁更快完成系统闭环。 时间差决定胜负,系统能力放大时间差< icon
  • 英伟达即将三月发布全新芯片LPU:起源于英伟达以200亿美元收购Groq,这笔交易的关键不在于SRAM,而在于数据流架构(Dataflow Architecture),数据流架构为英伟达新芯片奠定了基础架构! 很多人当初解读收购Groq是为了SRAM,其实 icon
  • autokernel 是一个面向 GPU 开发者的开源工具,核心目标只有一件事:让 AI 自动优化 CUDA kernel(GPU底层算子),从而显著提升深度学习和高性能计算的运行速度。简单说一句人话:它想把“GPU算子优化工程师”这份高难度工作,交给 AI 自动完成。 icon
  • ROCprof Trace Decoder 是一个专门用于 AMD GPU 线程跟踪(thread trace) 数据解码的插件库,它是 ROCm 生态中用于 GPU 性能分析的重要组件之一。 AMD开源rocprof-trace-decoder! icon
  • Nordic Semiconductor 十倍股密码:从蓝牙小芯片到卫星物联网的逆袭之路,一个挪威小厂如何靠一颗nRF9151芯片征服太空边缘计算 挪威有个芯片公司闷声发大财,它叫Nordic Semiconductor,主业是做低功耗无线连接芯片。这家公 icon
  • DoubleAI发布WarpSpeed系统,AI自主重写英伟达cuGraph全部GPU内核,平均提速3.6倍,100%算法获加速,开创人工专家智能新纪元,证明AI可在高推理深度领域超越人类顶尖工程师。  当AI GPU工程师的饭碗: icon
  • GPU霸主英伟达突然杀进CPU战场,Meta豪掷500亿美元买单。这不是简单的"我也卖芯片",而是一场从GPU到CPU、从硬件到软件的全生态围猎。当竞争对手还在造"兼容配件",英伟达已经在修"高速公路"——一条只有自家车能跑的特权通道。商场里的奢侈品店终于盯上 icon