• 英伟达多款产品遭曝光 包括明年将出的B300
  • 发布于 1周前
  • 61 热度
    0 评论
  • LoveC
  • 1 粉丝 52 篇博客
  •   

近日,多家媒体曝光了英伟达多款产品信息,其中包含专为 o1 推理大模型打造的 GPU 全新 B300,和万众瞩目的 RTX5090。据 SemiAnalysis 报道,全新的 B300 将采用与 B200 同样的台积电 4NP,但将是全新流片;功率方面,GB300 和 B300 HGX 的 TDP 分别达到 1.4KW 和 1.2KW,相比 B200 系列分别提高 0.2KW,同时架构也迎来创新,将会在 CPU 与 GPU 之间进行动态分配功率。B300 系列还将升级显存,将升级到 12 层的 12-Hi HBM3E,显存容量升级为 288GB,显存带宽仍为 8TB/s。


据 SemiAnalysis 透露,GB300 系列的交付也有所不同。此前,GB200 系列提供整个 Bianca Board,其中包括两颗 GPU、一颗 CPU、CPU 的内存等所有组件都集成在一块 PCB 板上。本次 GB300 系列则只提供 Reference Board,其中包括两颗 B300 GPU、一颗 Grace CPU、HMC(Hybrid Memory Cube),而 LPCAMM 内存模块等组件将由客户自行采购。报道称,这也将给 OEM 和 ODM 厂商带来新的方向与机会。


本次 B300 系列还将为推理大模型而打造。据悉,显存的升级对 OpenAI o1/o3 一类的推理大模型至关重要,因为推理思维链长度会增加 KVCache,影响 batch size 和延迟。本次 B300 的显存升级后,将带来这些提升:
1.实现更长的思维链
2.每个思维链的延迟更低
3.降低推理成本

4.处理同一问题时,可以搜索更多样本,最终提高模型能力


据了解,曝光的 PCB 板上没有印刷「NVIDIA」标识,因此有推测其为非公版 RTX5090 的 PCB 板,但仍能分析出部分 RTX5090 的参数。从目前曝光信息来看,RTX5090 所使用的 GB202 GPU 芯片,封装面积达 3628 平方毫米,实际的核心面积达 744 平方毫米,尺寸巨大;同时 RTX5090 将配备 16 颗显存芯片,若单颗容量 2GB GDDR7,总计将达 32GB 显存。


同时,RTX5090 的 GPU 核心照也遭曝光。据分析,RTX5090 完整的核心编号为 GB202-300-A1,与传闻相符。此外,RTX 5080、RTX 5070 Ti 则会改用次一级的 GB203 芯片;RTX 5070、RTX 5060 Ti 为 GB205;最低为 RTX 5060 的 GB206。
用户评论