英伟达GTC 2025亮点:AI模型升级带动更大推理算力,GB300、Rubin、CPO发布 AI需求可持续性:目前AI正在从生成式AI向助理式AI(agentic AI)发展,未来将向物理AI(Physical AI)发展。相比过去的生成式AI,agentic AI在推理过程中会有大量的reasoning过程存在,消耗的算力会有百倍级别的提升。scaling law有望从pre train向Post train扩展。 Blackwell进展:1)BLackwell已经开始全面出货,客户需求强劲,2024年美国四大云采购130万个Hopper GPU,2025年预计将采购360万颗Blackwell GPU die(两颗Blackwell GPU die对应一个芯片)。预计2028年全球数据中心CAPEX将超过1万亿美元。GB200在推理端相比Hopper提升明显,采用GB200 NVL72的数据中心在同样功耗下,相比H100可以产生40倍的token。2)发布Dynamo操作系统,支持GPU更好完成prefill到decode的各类要求。3)公司已经发布基于CUDA的一系列用于各类垂类行业的库,生态进一步丰富,是公司重要壁垒。 新产品进展:1)25H2量产Blackwell Ultra NVL72,采用CX8,单GB芯片具备288GB HBM3e的更大的显存容量。2)26H2量产Vera Rubin NVL144(命名方式与Blackwell不同,单rack 144个gpu die,共72个Rubin芯片),具备3.6EF FP4推理算力、1.2EF FP8 训练算力,相比GB300 NVL72提升3.3倍,单Rubin芯片具备288GB HBM4,采用NVLink6,机柜带宽260TB/s,网卡采用CX9。27H2量产Rubin Ultra NVL576。Rubin Ultra采用4个GPU die封装,具备1TB HBM4e容量,单卡算力100 PF FP4。Rubin Ultra NVL 576算力较GB300 NVL72提升14倍,HBM带宽提升8倍,NVlink带宽提升12倍,并采用CX9网卡。4)25H2量产Quantum-X InfiniBand CPO交换机。26H2量产Spectrum-X以太网CPO交换机。5)Rubin之后一代命名为Feynman,预计采用Vera Cpu、第八代NVlink switch、204T Spectrum CPO交换机、CX10。
英伟达GTC2025亮点:AI模型升级带动更大推理算力,GB300、Rubin
全产业
2025-03-19 09:21:34
0
阅读:14