近日,多家媒体曝光了英伟达多款产品信息,其中包含专为 o1 推理大模型打造的 GPU 全新 B300,和万众瞩目的 RTX5090。据 SemiAnalysis 报道,全新的 B300 将采用与 B200 同样的台积电 4NP,但将是全新流片;功率方面,GB300 和 B300 HGX 的 TDP 分别达到 1.4KW 和 1.2KW,相比 B200 系列分别提高 0.2KW,同时架构也迎来创新,将会在 CPU 与 GPU 之间进行动态分配功率。B300 系列还将升级显存,将升级到 12 层的 12-Hi HBM3E,显存容量升级为 288GB,显存带宽仍为 8TB/s。
据 SemiAnalysis 透露,GB300 系列的交付也有所不同。此前,GB200 系列提供整个 Bianca Board,其中包括两颗 GPU、一颗 CPU、CPU 的内存等所有组件都集成在一块 PCB 板上。本次 GB300 系列则只提供 Reference Board,其中包括两颗 B300 GPU、一颗 Grace CPU、HMC(Hybrid Memory Cube),而 LPCAMM 内存模块等组件将由客户自行采购。报道称,这也将给 OEM 和 ODM 厂商带来新的方向与机会。
4.处理同一问题时,可以搜索更多样本,最终提高模型能力
据了解,曝光的 PCB 板上没有印刷「NVIDIA」标识,因此有推测其为非公版 RTX5090 的 PCB 板,但仍能分析出部分 RTX5090 的参数。从目前曝光信息来看,RTX5090 所使用的 GB202 GPU 芯片,封装面积达 3628 平方毫米,实际的核心面积达 744 平方毫米,尺寸巨大;同时 RTX5090 将配备 16 颗显存芯片,若单颗容量 2GB GDDR7,总计将达 32GB 显存。