高通发布AI200与AI250杀入AI超算中心!768GB内存+10倍带宽


高通发布AI200与AI250数据中心推理方案,以高内存、近存计算、低TCO重塑生成式AI基础设施,2026年起陆续商用。


高通放大招!AI200与AI250横空出世,重新定义数据中心AI推理格局!

高通正式发布了面向数据中心的下一代AI推理解决方案:高通AI200和AI250!这可不是普通的芯片升级,而是高通首次以“整机柜”(rack-scale)的系统级思维,杀入生成式AI推理市场,目标直指英伟达、英特尔这些传统巨头。更关键的是,它主打“极致性价比”——每瓦每美元的性能做到行业领先,还承诺2026年和2027年分别量产,节奏快得惊人!

先说重点:高通这次不是小打小闹,而是带着完整的硬件+软件+生态组合拳来的。

AI200主打高内存容量和低总拥有成本(TCO),单卡支持高达768GB的LPDDR内存——你没听错,是768GB!这在当前主流AI加速卡里几乎是天花板级别的配置,特别适合运行大语言模型(LLM)和多模态模型(LMM)这类“吃内存”的任务。而更狠的AI250,则引入了“近存计算”(near-memory computing)架构,号称带来“代际级飞跃”——有效内存带宽提升10倍以上,功耗却大幅降低。

这意味着什么?意味着同样一机柜,你能跑更多模型、服务更多用户,电费还省一大截!

说到这儿,可能有朋友要问:高通不是做手机芯片的吗?怎么突然杀进数据中心了?其实这背后,是高通过去十年在AI和高性能计算领域默默布局的结果。高通早在骁龙移动平台上就深耕NPU(神经网络处理单元)技术,积累了大量低功耗、高能效的AI推理经验。

如今,他们把这套技术“放大”到数据中心场景,用熟悉的架构思维解决新问题——不是堆算力,而是优化“每一分钱能买到的AI性能”。

这次发布的产品由高通技术公司(Qualcomm Technologies, Inc.)主导,其技术规划、边缘解决方案与数据中心业务高级副总裁兼总经理杜尔加·马拉迪(Durga Malladi)亲自站台。这位大佬在芯片行业摸爬滚打几十年,曾深度参与高通从移动通信向AI计算的战略转型。

在他的带领下,高通的数据中心团队不仅聚焦硬件,更构建了一套“超丝滑”的软件栈——从应用层到底层系统软件全链路优化,支持TensorFlow、PyTorch等主流框架,还能一键部署Hugging Face上的热门模型。开发者不用重写代码,就能快速把训练好的大模型部署到高通平台上,真正实现“开箱即用”。

更值得称道的是,这两套解决方案都采用了直接液冷散热,整机柜功耗控制在160千瓦——在当前动辄200kW+的AI机柜中,这已经相当克制。同时,它们支持PCIe用于纵向扩展(scale-up),以太网用于横向扩展(scale-out),还内置了机密计算(confidential computing)功能,确保客户的数据和模型在推理过程中不被窥探。安全、高效、灵活,三位一体。

高通这次的野心不止于一两款产品。他们明确表示,AI200和AI250只是“多代数据中心AI推理路线图”的开端,未来将以每年一代的节奏持续迭代。这意味着,高通不是来“试水”的,而是要长期扎根AI基础设施市场。对于那些被英伟达GPU高昂价格和供应紧张困扰已久的云服务商、企业客户来说,高通的入场无疑是一剂强心针——终于有另一个选择,而且是带着“低TCO+高能效”标签的选择。

尤其值得注意的是AI250的“近存计算”架构。传统AI芯片的瓶颈往往不在算力,而在内存带宽——数据从内存搬到计算单元要花大量时间和功耗。高通通过将计算单元尽可能靠近内存,大幅缩短数据搬运路径,从而实现10倍以上的有效带宽提升。这不仅是技术突破,更是对整个AI硬件设计哲学的挑战:与其疯狂堆算力,不如先解决“内存墙”问题。

对于中国市场的读者来说,这个消息还有另一层意义。随着国产AI芯片加速追赶,国际巨头之间的竞争将更加激烈,最终受益的一定是用户。高通若能凭借其成熟的软件生态和全球供应链优势快速落地,或将改变当前AI推理市场的格局。特别是对那些需要大规模部署生成式AI应用的互联网公司、金融企业、智能客服平台而言,高通提供的“高内存+低功耗+易部署”组合,极具吸引力。

最后别忘了,高通还专门打造了“高效Transformer库”和“高通AI推理套件”,让开发者能轻松优化大模型推理性能。比如支持“解耦式服务”(disaggregated serving)——把模型的不同部分部署在不同硬件上,按需调用,极大提升资源利用率。这种细粒度的优化能力,正是企业级AI落地的关键。

总结一下:高通AI200和AI250不是简单的硬件发布,而是一场针对AI推理基础设施的系统性革新。它用手机芯片的能效思维,重构数据中心的性价比标准;用完整的软硬一体方案,降低企业部署生成式AI的门槛;用每年迭代的承诺,宣告自己在AI时代的长期野心。