• 基于泄露信息深度剖析GPT-5.4的颠覆性升级。从像素级视觉到自主执行任务,再到2M token上下文和持久状态带来的硬件革命,解读为何这将是人工智能史上的真正代际飞跃,以及光学互联等硬件如何应对KV缓存爆炸。 这么说吧,以前的人工智能,就像一个记忆力只有
  • 事件驱动架构比传统框架更靠谱:详细拆解了Utah项目的六个核心函数、子智能体委托机制、上下文管理技巧,以及如何用TypeScript和Inngest构建持久的智能体系统。 想象一下,你是一个赛车手,开着一辆超炫的跑车。引擎嗡嗡响,轮胎冒青烟,各种仪
  • 2026年开年三周,七大中国AI实验室密集发布前沿模型,MoE架构、开源权重、Agent能力成为共同标签,定价仅为西方竞品十分之一,国产芯片与自主可控战略取得突破性进展。 中国AI春节档七连发:DeepSeek去年炸场引发万亿市值蒸发,今年 icon
  • 英伟达GTC 2026或发布Rubin CPX与LPX异构推理芯片,分别针对Prefill计算与Decode内存带宽优化,采用SRAM架构与GDDR7分层内存,配合Dynamo软件重构AI基础设施格局。 icon
  • 英伟达即将三月发布全新芯片LPU:起源于英伟达以200亿美元收购Groq,这笔交易的关键不在于SRAM,而在于数据流架构(Dataflow Architecture),数据流架构为英伟达新芯片奠定了基础架构! 很多人当初解读收购Groq是为了SRAM,其实 icon
  • 北大清华和DeepSeek团队发现Agentic LLM推理卡在存储带宽上,GPU闲得发慌网卡累成狗。他们搞了个DualPath双路径加载机制,让闲着的那半边网卡也干活,结果吞吐量翻倍,延迟还稳得像老干部喝茶。 现在的智能体那是真智能,自己会调工具 icon
  • 当整个行业都在烧钱建数据中心、囤GPU、搞液冷超算时,一家成立仅两年半的加拿大公司Taalas掏出了一块"硬编码"芯片,把Llama 3.1 8B模型的推理速度干到了每秒17000个token——比英伟达H200快将近10倍,成本只有二十分之一,功耗少了90%。他们没有HBM,没有先进封装, icon
  • AI智能体正面临隐形成本危机,MCP协议因冗余的JSON Schema导致Token浪费。用CLI命令行技术实现94%的成本削减,并深度解析CLIHub工具的革命性优势。 现在的AI智能体,特别是那些用MCP(Model Context Proto icon
  • AI芯片战场迎来新玩家,MatX用5亿美元押注能同时驾驭高速缓存SRAM与大容量内存HBM的终极方案,目标直指英伟达霸主地位。 想象一下你在玩游戏。电脑里其实有两个存东西的地方:第一个在CPU旁边,叫“口袋”SRAM。它的速度飞快,你伸手就 icon
  • 谷歌数据中心搞了个铁-空气电池,这个超级充电宝能撑四天四夜不断电 这个事情要从美国明尼苏达州说起。有一家叫Form Energy的创业公司,他们研发了一种新型电池,是用铁和空气来储存电的,专门用来存太阳能、风能这些清洁能源,而且存的时间比我们现在常 icon
  • 光子学是AI基础设施的神经中枢。随着模型规模爆炸,光互连取代铜缆成为刚需,七层产业链从磷化铟衬底到光模块正经历结构性短缺,利润向上游材料与测试环节迁移。 光子学正在从幕后走向台前,成为AI基础设施中最关键的物理瓶颈。当英伟达(Nvidia)的GPU和AMD icon
  • 激光界的“神仙打架”:Lumentum如何靠硬核物理把对手按在地上摩擦。本文以幽默脱口秀形式解析AI时代光模块激战,揭秘Lumentum如何靠技术壁垒与Coherent拉开差距,以及测试设备Keysight透露的真实需求。 最近科技新闻里总出现两个 icon
  • ROCprof Trace Decoder 是一个专门用于 AMD GPU 线程跟踪(thread trace) 数据解码的插件库,它是 ROCm 生态中用于 GPU 性能分析的重要组件之一。 AMD开源rocprof-trace-decoder! icon
  •  深度拆解AI时代半导体行业八大瓶颈关卡,从CPU到GPU转型、内存墙、HBM短缺、先进封装、电力荒到光通信,带你看清算力扩张背后的硬核技术博弈与投资机会。 算力中心半导体瓶颈接力赛:AI时代生存必修课 AI这玩 icon
  • Nordic Semiconductor 十倍股密码:从蓝牙小芯片到卫星物联网的逆袭之路,一个挪威小厂如何靠一颗nRF9151芯片征服太空边缘计算 挪威有个芯片公司闷声发大财,它叫Nordic Semiconductor,主业是做低功耗无线连接芯片。这家公 icon
  • 英伟达(Nvidia)周一宣布向 Lumentum 和 Coherent 各投资20亿美元,押注光子学技术成为AI数据中心的下一代"高速公路",应对智能体(agent)爆发带来的带宽饥渴。 如今的旗舰级AI机架使用超过5000根铜缆连接72个GPU。下一代 icon
  • 纳米战争退场,微米战争登基,玻璃走上王座候选席 过去五十年,半导体行业只有一个信仰:缩小。晶体管越小,芯片越猛,算力越炸。十纳米、五纳米、三纳米,一路往下卷,卷到物理定律站出来敲黑板:尺度触底,规则锁死。晶体管继续缩小的空间被自然法则封顶,行业逻辑随之转向 icon
  • GPU霸主英伟达突然杀进CPU战场,Meta豪掷500亿美元买单。这不是简单的"我也卖芯片",而是一场从GPU到CPU、从硬件到软件的全生态围猎。当竞争对手还在造"兼容配件",英伟达已经在修"高速公路"——一条只有自家车能跑的特权通道。商场里的奢侈品店终于盯上 icon