黄仁勋GTC抛出万亿美元收入预期,Rubin平台新芯片亮相

Source

  当地时间3月16日,英伟达GTC大会在圣何塞SAP中心召开。英伟达CEO黄仁勋演讲开始前2个小时,会场的一半座位就已经坐满了人。面对观众的热情,黄仁勋一上台就开了个玩笑,提醒观众称,这是一场科技会议。

  今年现场参加英伟达GTC大会的有3万多人,有1000多场涉及AI基础设施、推理、机器人等领域的会议。最受关注的还是黄仁勋的这个演讲。此前外界猜测黄仁勋将公布有关CPO、Groq芯片和新芯片架构的信息,这些信息在今天的大会中均有涉及,但并非这场会议的全部内容。

  黄仁勋现场反复强调的是英伟达正在努力做的协同设计和垂直整合,以及英伟达与上下游的合作,同时也涵盖了有关太空计算、自动驾驶等业务的信息,显示出英伟达当前涉及业务的深入与广阔覆盖面。除了在地面数据中心使用的芯片和机架,黄仁勋还公布了英伟达的多个开源模型和新的太空计算模块。

  新芯片亮相

  Rubin是英伟达当前正着力推动上市的芯片平台,此前在CES上,黄仁勋已介绍了Vera CPU、Rubin GPU、NVLink 6交换机、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6以太网交换机6颗芯片,此次Groq 3 LPU首次亮相。据介绍,Groq芯片正在全力生产,下半年将发货。Groq芯片由三星代工生产。

  关于Rubin平台中的CPU芯片,此次英伟达也做出介绍,称这是全球首款专为智能体AI和强化学习打造的处理器,效率是传统机架级CPU的两倍,目前计划部署的云服务提供商包括阿里巴巴、字节跳动、Cloudflare等。

  至此,Rubin平台的芯片扩充至7颗,此外还包括5个机架,共同组成一台AI超级计算机。5个机架中,Groq 3 LPX机架为智能体系统低延迟和长上下文需求设计。据介绍,Groq 3 LPX与Rubin CPU和GPU一起使用可将每兆瓦推理吞吐量提高35倍,有望使万亿参数模型推理的收入提高10倍。LPX机架配备256个LPU,有128GB片上SRAM和640TB/s扩展带宽,将在今年下半年集成到下一代Vera Rubin AI工厂中。

  此外,Vera Rubin CPU机架集成256个Vera CPU,与GPU计算机架一起部署时,效率是传统系统的2倍。BlueField-4 STX存储机架由BlueField-4驱动,结合Vera CPU和ConnectX-9 SuperNIC。Spectrum-6 SPX以太网机架则为AI工厂横向扩展而设计。

  相比传统可插拔光学器件,Spectrum-X以太网光子技术采用共封装光学器件,光功率效率提高5倍,容错能力提高10倍。据黄仁勋介绍,世界上首个采用CPO 的Spectrum-X交换机正在全力生产,共封装的光学器件直接连接到芯片上,将电子转化为光子。

  Vera Rubin NVL72则集成72个Rubin GPU和36个Vera CPU,通过NVLink 6连接,配备ConnectX-9 SuperNIC和BlueField-4 DPU。使用Vera Rubin NVL72训练大型混合专家模型,所需GPU数量是Blackwell平台的1/4,每瓦推理吞吐量提高10倍,每token成本降低至1/10。

  黄仁勋表示,英伟达已经搭建起一套供应链,每周可以生产数千个Rubin系统,基本上用于吉瓦级数据中心。

  Rubin之后的架构还在进化。在现场,黄仁勋还展示了Rubin之后的下一代架构Rubin Ultra,称Rubin Ultra有一个全新的机架,新的NVLink将连接144个GPU。

  两大芯片平台将带来1万亿美元收入

  GTC大会中的一个高潮,来自黄仁勋对AI芯片带来收入的判断。

  “去年这个时候,我看到2025年至2026年来自Blackwell和Rubin的5000亿美元订单收入,这是一笔巨大的收入。”黄仁勋说,而在一年之后,他看到2025年至2027年这部分收入将达到1万亿美元。

  从客户变化和组成看,黄仁勋表示,2025年至今,成为英伟达新合作伙伴的包括Anthropic、MSL、Multiple OSS。英伟达来自超大规模云服务商的收入占比60%,还有40%来自无处不在的AI需求,包括区域云、企业云、工业AI、机器人、边缘AI、小服务器等。演讲到这里时,英伟达股价瞬间涨超4%。

  对于英伟达部署的业务和思路,黄仁勋做了较为系统性的阐述。今年1月他强调英伟达在做协同设计后,此次再次强调,英伟达每token的成本是全世界最低的,一个重要原因是进行了协同设计。并表示,未来每家计算机公司、云厂商都会考虑token生产的效率。

  除了做协同设计,黄仁勋还强调了自己在生态链中的位置。他表示,英伟达是一家垂直整合的公司,需要了解算法、应用程序、如何在所需场景中部署算法,无论是数据中心还是边缘端的机器人,还要整合芯片和系统。

  “今天来的观众代表了我们上下游的庞大生态系统。不论是成立了150年、15年还是7年的公司,现在都是我们的供应链上下游,祝贺你们去年创造了纪录。”黄仁勋称。从英伟达业务的涉及范围看,他在PPT上展示出了自动驾驶、金融服务、健康与生命科学、工业、娱乐业、量子领域、机器人和电信这几个领域。

  谈到AI给科技行业带来的改变,黄仁勋表示,过去3年模型层面发生了三件重要的事情,2023年ChatGPT开启了生成式AI革命,推理式AI o1出现使AI能自己思考、分解问题,让token增加了10倍,2025年出现的首个代理式AI Claude Code则让token增加了100倍。随着AI能做一些创造性工作,AI推理迎来了拐点,过去两年工作所需计算需求增加了1万倍。

  他指出,去年AI原生初创企业吸引了约1500亿美元的投资,这是史上最高的一个时期,投资事件的投资规模也从数百万美元、数千万美元增长到数亿美元、数十亿美元。原因是历史上第一次有这么多公司都需要大量的计算,需要由OpenAI、Anthropic等公司生产的很多token。

  “就像PC时代诞生一批公司、互联网时代诞生一批公司,现在这一代人也将拥有一批特殊的公司。我们重新发明了计算,就会出现一批全新的、对世界未来产生重大影响的公司。”黄仁勋表示。

  黄仁勋也谈及AI将给电信业、汽车行业带来的改变,称世界上最大的基础设施之一的电信基站正在面临彻底改造,未来基站将成为AI基础设施平台,AI将会在边缘端运行。此外,英伟达宣布了获得四个汽车新客户,包括比亚迪、吉利、五十铃和日产,它们正开发基于英伟达DRIVE Hyperion平台的开发L4车辆,英伟达还宣布与Uber合作,在多个城市中,Robotxi将连接到Uber的网络中。黄仁勋表示,自动驾驶汽车的OpenAI时刻已经到来,未来Robotaxi的数量将难以置信。

  还有更多产品在GTC大会公布。太空计算方面,英伟达宣布,Vera Rubin太空模块是成为英伟达太空加速平台的最新组成部分,与H100相比,该模块上的Rubin GPU能为天基推理提供25倍的AI算力。

  机器人方面,英伟达推出Isaac仿真框架、Cosmos和Isaac GROOT的新开源模型,供行业开发、训练和部署下一代智能机器人。其中Cosmos 3是首个统一合成世界生成、物理 AI 推理和动作模拟的世界基础模型。自动驾驶方面,英伟达还推出推理 VLA 模型(视觉动作语言)Alpamayo 1.5,用于增强自动驾驶汽车的推理能力。

  英伟达在软件方面的部署越来越多,此次推出了开源模型Nemotron 3系列,用于给智能体提供自然对话、复杂推理和高级视觉能力。英伟达还与Cursor、LangChain、Mistral AI等成立Nemotron联盟,联合这些实验室共同开发开放式前沿基础模型。在医疗方面,则推出了一些基础模型和数据集,包括用于蛋白质结合剂设计的生成模型Protein-Complexa。对于近期大火的智能体应用OpenClaw,英伟达推出了NemoClaw 软件栈,并集成Nemotron模型和OpenShell运行环境,以提供开放模型和一个隔离的沙箱,补齐安全、隐私与沙箱能力。

点击进入专题:
英伟达GTC 2026

责任编辑:张玉