NVIDIA Vera Rubin架构将为AI推理带来十倍成本优化

  在2026年国际消费电子展(CES)上,NVIDIA首席执行官黄仁勋正式揭晓了下一代人工智能计算架构“维拉·鲁宾”(Vera Rubin)。该架构预计将成为未来游戏显卡的基础,并已进入全面投产阶段,计划于今年下半年开始向客户交付。

游侠网1

  作为当前Blackwell架构的继任者,维拉·鲁宾在性能上实现显著突破。据NVIDIA介绍,其在推理任务中性能提升高达5倍,大型语言模型训练效率提高3.5倍,同等任务所需GPU数量可减少至原先的四分之一。

游侠网2

游侠网3

  该架构主要由六大核心组件构成:

  基于Armv9.2的88核Vera中央处理单元

  采用NVFP4格式、算力达50 petaflops的Rubin图形处理单元

  带宽达3.6 TB/s的第六代NVLink交换机

  ConnectX-9 SuperNIC网络适配器与BlueField-4数据处理单元

  Spectrum 6以太网交换机

游侠网4

  新架构在能效与可靠性方面尤为突出。通过集成Spectrum-X以太网光子技术与光学连接,功耗降低至原先的五分之一,连接可靠性则提升十倍。黄仁勋指出,这一飞跃得益于制造工艺的进步,尽管晶体管数量仅增加1.6倍,但整体效能大幅跃升。首批合作客户将包括云服务商CoreWeave与Microsoft Azure。

  此次发布正值AI加速器市场竞争加剧之际。面对AMD等传统对手以及谷歌等客户自研芯片的挑战,NVIDIA试图通过维拉·鲁宾架构实现性能与成本的双重突破——预计将使AI推理的每token成本下降至原来的十分之一。

0