• Palantir的Maven Smart System(MSS,Maven智能系统)在北约创新周上演了一场军事科技界的"速度与激情",德国Quantum Systems、法国SARInsight、英国Hadean三家公司在三周内完成了与MSS的深度集成,展示了AI如何打通卫星侦察、无人机指挥和作战规
  • 基于泄露信息深度剖析GPT-5.4的颠覆性升级。从像素级视觉到自主执行任务,再到2M token上下文和持久状态带来的硬件革命,解读为何这将是人工智能史上的真正代际飞跃,以及光学互联等硬件如何应对KV缓存爆炸。 这么说吧,以前的人工智能,就像一个记忆力只有
  • 英伟达GTC 2026或发布Rubin CPX与LPX异构推理芯片,分别针对Prefill计算与Decode内存带宽优化,采用SRAM架构与GDDR7分层内存,配合Dynamo软件重构AI基础设施格局。 icon
  • 事件驱动架构比传统框架更靠谱:详细拆解了Utah项目的六个核心函数、子智能体委托机制、上下文管理技巧,以及如何用TypeScript和Inngest构建持久的智能体系统。 想象一下,你是一个赛车手,开着一辆超炫的跑车。引擎嗡嗡响,轮胎冒青烟,各种仪 icon
  • 英伟达即将三月发布全新芯片LPU:起源于英伟达以200亿美元收购Groq,这笔交易的关键不在于SRAM,而在于数据流架构(Dataflow Architecture),数据流架构为英伟达新芯片奠定了基础架构! 很多人当初解读收购Groq是为了SRAM,其实 icon
  • 北大清华和DeepSeek团队发现Agentic LLM推理卡在存储带宽上,GPU闲得发慌网卡累成狗。他们搞了个DualPath双路径加载机制,让闲着的那半边网卡也干活,结果吞吐量翻倍,延迟还稳得像老干部喝茶。 现在的智能体那是真智能,自己会调工具 icon
  • AI芯片战场迎来新玩家,MatX用5亿美元押注能同时驾驭高速缓存SRAM与大容量内存HBM的终极方案,目标直指英伟达霸主地位。 想象一下你在玩游戏。电脑里其实有两个存东西的地方:第一个在CPU旁边,叫“口袋”SRAM。它的速度飞快,你伸手就 icon
  • AI智能体正面临隐形成本危机,MCP协议因冗余的JSON Schema导致Token浪费。用CLI命令行技术实现94%的成本削减,并深度解析CLIHub工具的革命性优势。 现在的AI智能体,特别是那些用MCP(Model Context Proto icon
  • 当整个行业都在烧钱建数据中心、囤GPU、搞液冷超算时,一家成立仅两年半的加拿大公司Taalas掏出了一块"硬编码"芯片,把Llama 3.1 8B模型的推理速度干到了每秒17000个token——比英伟达H200快将近10倍,成本只有二十分之一,功耗少了90%。他们没有HBM,没有先进封装, icon
  • 谷歌数据中心搞了个铁-空气电池,这个超级充电宝能撑四天四夜不断电 这个事情要从美国明尼苏达州说起。有一家叫Form Energy的创业公司,他们研发了一种新型电池,是用铁和空气来储存电的,专门用来存太阳能、风能这些清洁能源,而且存的时间比我们现在常 icon
  • 激光界的“神仙打架”:Lumentum如何靠硬核物理把对手按在地上摩擦。本文以幽默脱口秀形式解析AI时代光模块激战,揭秘Lumentum如何靠技术壁垒与Coherent拉开差距,以及测试设备Keysight透露的真实需求。 最近科技新闻里总出现两个 icon
  • 光子学是AI基础设施的神经中枢。随着模型规模爆炸,光互连取代铜缆成为刚需,七层产业链从磷化铟衬底到光模块正经历结构性短缺,利润向上游材料与测试环节迁移。 光子学正在从幕后走向台前,成为AI基础设施中最关键的物理瓶颈。当英伟达(Nvidia)的GPU和AMD icon
  • Nordic Semiconductor 十倍股密码:从蓝牙小芯片到卫星物联网的逆袭之路,一个挪威小厂如何靠一颗nRF9151芯片征服太空边缘计算 挪威有个芯片公司闷声发大财,它叫Nordic Semiconductor,主业是做低功耗无线连接芯片。这家公 icon
  • ROCprof Trace Decoder 是一个专门用于 AMD GPU 线程跟踪(thread trace) 数据解码的插件库,它是 ROCm 生态中用于 GPU 性能分析的重要组件之一。 AMD开源rocprof-trace-decoder! icon
  • 英伟达(Nvidia)周一宣布向 Lumentum 和 Coherent 各投资20亿美元,押注光子学技术成为AI数据中心的下一代"高速公路",应对智能体(agent)爆发带来的带宽饥渴。 如今的旗舰级AI机架使用超过5000根铜缆连接72个GPU。下一代 icon
  • DoubleAI发布WarpSpeed系统,AI自主重写英伟达cuGraph全部GPU内核,平均提速3.6倍,100%算法获加速,开创人工专家智能新纪元,证明AI可在高推理深度领域超越人类顶尖工程师。  当AI GPU工程师的饭碗: icon
  • GPU霸主英伟达突然杀进CPU战场,Meta豪掷500亿美元买单。这不是简单的"我也卖芯片",而是一场从GPU到CPU、从硬件到软件的全生态围猎。当竞争对手还在造"兼容配件",英伟达已经在修"高速公路"——一条只有自家车能跑的特权通道。商场里的奢侈品店终于盯上 icon
  • Biomni智能体通过构建定制化高性能计算环境,让生物医学AI获得与研究人员同等的算力权限。该系统采用灵活抽象架构,允许智能体在预配置环境中编写shell命令而非调用固定API,支持GPU集群、TB级参考数据库和异步任务调度,解决了生物信息学工具依赖冲突、资源需求波动等核心痛点,实现了从笔记本电脑到 icon