产业链更新全面加速!英伟达宣布“一年一迭代” 丨AI脱水

在Computex 2024上,黄仁勋(Jensen Huang)手持Blackwell芯片,再一次证明了英伟达的全栈能力。

相比于GPU卖家,全栈厂商需要考量的不再仅仅是GPU,还包括软件平台、网络服务、散热产品、配套CPU等产品。

英伟达CEO黄仁勋在此次大会上给出了一一的解答。

·芯片一年一迭代:2025年推出Blackwell Ultra GPU、2026年推出Rubin GPU、2027年推出Rubin Ultra GPU;

·推出下一代架构:2026年推出下一代架构Rubin;

·Spectrum-X“年更”:2026年,Spectrum-X1600可连接数百万个GPU;

·散热不局限于“液冷”:Blackwell架构同时推出风冷DGX和液冷MGX两款服务器;

·软件平台:软件业务不仅是英伟达护城河,而且会成为一个巨大的生意

01

处理器

首先,还是先来看一下英伟达的处理器,分别是GPU和CPU。

会议上,黄仁勋说,“接下来更新节奏将以一年为周期,把所有产品推向技术极限。”

并重磅披露了未来三代的技术栈(见下图):

·2025年推出Blackwell Ultra GPU(8S HBM3e 12H);

·2026年推出Rubin GPU(8S HBM4),以及新一代基于Arm的Vera CPU,以及NVLink 6 Switch(3600GB/s);

·2027年推出Rubin Ultra GPU(12S HBM4);

性能上,Rubin GPU和vera CPU的具体参数暂未披露。但是英伟达在模型训练上已经充分体现了体能提升,价格下降这一宗旨:

·过去8年,1.8万亿参数GPT-4的训练能耗,直接疯狂降到1/350,推理能耗降至1/45000;

·过去8年,算力提升了1000倍; 

产业链更新全面加速!英伟达宣布“一年一迭代” 丨AI脱水

产业链更新全面加速!英伟达宣布“一年一迭代” 丨AI脱水

02

处理器架构

黄仁勋揭露了Blackwell的下一代架构将是Rubin架构,将于2026年首次推出。新亮点是将配备HBM4内存。

根据外媒wccftech报道,英伟达的Rubin GPU将采用台积电的CoWoS-L先进封装技术,并采用N3制程工艺。

此外,英伟达将为2026年推出的Rubin GPU配备下一代HBM4内存。目前,英伟达在其B100 GPU中使用的是最快的HBM3E内存。

这意味着在2025年底,HBM4内存可能就会大规模生产。

另外,英伟达还将推出基于ARM架构的新一代CPU —— Vera CPU,与Rubin GPU搭配,形成全新的Vera Rubin平台超级芯片。该平台将支持新的CX9 SuperNIC和NVLink 6技术,提供高达1600GB/s和3600GB/s的连接速度。

03

通信网络——以太网

此次大会上,英伟达首次提到了百万级GPU互连的以太网络解决方案,且预计将于2026年推出。届时,3.2T光模块或将成为主流。

“数百万GPU数据中心的时代即将到来!”黄仁勋会上,出了未来三年的以太网络Spectrum产品路线,并宣布将每年推出新的Spectrum-X产品。

·2024年,Spectrum-X800为数万个GPU而设计;

·2025年,X800 Ultra为数十万个GPU而设计;

·2026年,X1600则可扩展至数百万个GPU;

先前,不论是Arista还是英伟达,都仅公布了十万级别的GPU连接产品:

·英伟达:Spectrum-X已经与多家客户进入了量产阶段, 其中包括一个10万GPU的大型集群;

·Arista:预测公司在2025年可以连接10万GPU;

根据会议(见下图)2026年交换机速率较2024年将会翻倍,意味着2026年光模块将进入3.2T时代(目前是1.6T)

产业链更新全面加速!英伟达宣布“一年一迭代” 丨AI脱水

04

风冷DGX和液冷MGX

Blackwell推出后,市场一度传出服务器将使用液冷来散热。

此次大会上,英伟达提到,将同时构建风冷DGX和液冷MGX两种散热模式的服务器产品。

此外,相比于先前的GTC大会,黄仁勋披露了更详细的Blackwell架构的数据:

·DGX的AI算力提升到上一代的45倍,达到1440PFLOPS,而能耗仅为上一代的10倍;

·新一代DGX能搭载72个GPU,背后由NVLink 5000根电缆组成的主干支持,能为一个机架节省20kW电能;

产业链更新全面加速!英伟达宣布“一年一迭代” 丨AI脱水

05

软件开发平台

软件业务不仅是英伟达护城河,而且会成为一个巨大的生意

这些软件业务包括:CUDA、NIM、Omniverse等(见下图)。

会议上,英伟达再次强调了NIN和Omniverse的重要性,

1)NVIDIA NIM推理微服务能将企业部署生成式AI应用的时间从几天压缩到几分钟;

2)Omniverse:Omniverse 是一个虚拟世界模拟开发平台,该平台可以最大限度地减少模拟与现实的差距。开发者可以在 Omniverse 中测试、训练和集成所有东西。正如视频所说,机器人可以在虚拟世界里学习如何成为机器人;

产业链更新全面加速!英伟达宣布“一年一迭代” 丨AI脱水

面向未来,英伟达积极布局了机器人领域、以及开发基于AI技术的应用——Earth。通过不断创新和探索,英伟达有望在推动全球技术进步和改善人类生活方面发挥更大的作用。

欢迎加入东西智库微信群,专注制造业资料分享及交流(微信扫码添加东西智库小助手)。