一文读懂GB300(系列文章二)
消息称英伟达GB300AI服务器预计今年Q2发布。英伟达预计2025年3月GTC大会正式发布下一代GB300 AI服务器产品线。而在此之前,鸿海、广达等供应链产生已经先动起来了,进入了GB300 AI服务器研发设计阶段。据悉,英伟达已初步敲定GB300 AI服务器订单的配置,鸿海仍是最大供应商,预计明年上半年有望推出实机面市,脚步领先全球同行业。鸿海除了在GB200系列即掌握的芯片模组、组装等供应链,也陆续投入水冷系统、连接器等领域,并进行相关验证中。
据Digitimes2日报道,供应链消息称GB300服务器正在如火如荼地设计中,预计今年Q2发布、Q3试产。据悉GB300的散热需求更强,主板风扇使用数量更少,这也意味着其液冷散热需求将会更强。在芯片侧方面,GB300超级芯片将基于更新的B300GPU,拥有更强的FP4性能。该GPU功耗将从B200的1000W进一步提升至1400W,达到初代B100的两倍;同时HBM内存规格也将升级共计288GB的8堆栈12HiHBM3E。
大摩预计,英伟达下一代AI GPU GB300有望在今年四季度批量出货,该系列可能会引入GPU插槽、增设冷板模块并采用更高功率的电源模块,且英伟达将减少参与度,赋予ODM(原始设计制造商)更多设计空间。
NVIDIA 的 GB300 AI 服务器是一款性能强大、配置高端的人工智能服务器,以下是其具体介绍:
技术参数
芯片性能:采用全新的 B300 GPU 芯片,FP4 性能相较于前一代 B200显著提升了1.5倍,单卡功耗为1400W,达到初代B100的两倍257。
内存配置:每个GPU配备288GB的HBM3E内存,采用8堆栈12HiHBM3E技术,相比GB200提升了近50%,在处理大规模数据和运行复杂AI模型时更具优势257。
网络功能:内置全新的ConnectX-8网卡,替代了之前的ConnectX-7,同时光模块带宽从800G升级到了1.6T,大大提高了数据传输效率25。
冷却系统:由于性能提升导致功耗大幅增加,采用全水冷散热方案,通过水冷板和增强型UQD技术,确保服务器在高强度运算时能保持稳定状态234。
电源管理:GB300NVL72机柜配备了标准化超级电容UPS,并提供可选的后备电池(BBU)系统,每个BBU模块制造成本约为300美元,每个NVL72机架需要超过300个单元,每个单元生产成本在20至25美元之间25。
升级1:计算性能+50%,功耗+17%,利好液冷、电源。
GB300Flops计算性能提升了50%,同时内存从8个HBM3E升级到12个。计算性能和内存的提升,带动功耗提升,GB300单卡功耗为1.4kW,而GB200为1.2kW,提升幅度约为17%。同时,预计Rubin版本功耗将达到1.8kW,较GB200提升50%,较H100提升157%。
散热、电源等环节与服务器功耗紧密相关,产品有望升级,用量或将明显增长。散热方面,GB300的设计中水冷板、液冷系统、UQD快速接口的使用量或将明显增加。电源方面,GB300或将升级超级电容和BBU技术,确保在断电等突发情况下,系统能够安全关闭,避免数据丢失。
升级2:网卡从CX7升级至CX8,1.6T光模块成标配
GB300的网卡将从CX7升级至CX8,网络规模、性能均得到明显提升。网卡升级对光模块带来两方面影响,一是光模块规格升级,1.6T光模块成为GB300的标配;二是组网规模扩大,网络在AI投资的占比或将提升。当前,海外头部厂商正在着力打造十万卡、甚至百万卡集群,网络的层数和复杂度提升,将带来网络投资的指数增长。根据博通,当前网络在AI的投资占比在5%-10%之间,当集群规模扩大至50万至100万时网络投资占比会上升至15%-20%。
升级3:强化模块化设计思路,有望引入更多供应商
GB300增加了内存模组和GPUsocket,使得组装和替换更加灵活。这种模块化设计不仅提高了系统的可维护性,还为未来的定制化提供了更多可能性。同时,随着机柜设计日益成熟,GB300有望在液冷、PCB、连接器等环节引入更多的供应商。
具体主要变化:
1.引入GPU插槽:英伟达计划为即将推出的第二代BlackwellB300系列处理器引入插槽设计,替代传统的直接表面贴装(SMT)。此举旨在改善低生产良率问题(目前Wistron计算板的良率为80%,而UBB良率超过90%)并提高维修性。初期插槽由FIT供应,未来可能会引入Lotes作为第二供应商。
GB300设计将采用插座以增强可靠性和便于维修,这一变化也将影响PCB设计,预计GB300计算托盘将采用两块独立的PCB,而插座区域将采用HDI,UBB区域则采用多层PCB。
PCB替代HDI和过孔。在GB300产品中,预计计算托盘的PCB价值将增加,原因包括:
1)在插座区域额外使用HDI(M4M7混合,类似于当前计算托盘设计),
2)计算托盘采用至少M7级别材料的高价值多层PCB。研报建议关注是否会采用M8级别CCL(仍在讨论中)。如果采用M8CCL,其价格几乎是M7CCL的两倍,而计算托盘占GB200PCB内容价值的一半,这意味着PCB内容价值可能增加40-50%。
PCB:当前3个开关托盘PCB供应商可能继续参与新计算托盘设计,HDI。
CCL:如果采用M8级别CCL,EMC(2383TT)和Nittobo(3110JP)具有上升空间。如果采用NER玻璃价格是NE玻璃的两倍。3)适配器。
此外B300GPU有望采用插槽设计以提升良率、简化售后维护;而在GraceCPU部分则将采用LPCAMM内存条代替现有的板载LPDDR5。
2.增设冷板模块:由于GPU插槽的采用,新冷板模块可能会为每个GPU/CPU单独设计,并使用新型体积更小的NVQD取代GB200中的UQD(快换接头)设计。主要供应商包括CoolerMaster和AVC集团,Fositek、FII和Lotes也可能受益。
3.更高功率的电源模块:独立电源架有望被引入,以满足更高的可靠性和功率需求。GB300的电源单元将支持10kW和12kW,适用于60kW和72kW的电源架,具体取决于机架兼容性、生产验证和可靠性测试。
4.ODM(原始设计制造商)的价值将有所提升。与GB200相比,英伟达将在GB300的机械组件设计中减少参与度,这将赋予ODM更多设计空间。ODM可以为超大规模客户(hyperscalers)提供定制化设计服务,潜在地提升其利润率。
5.NVIDIA将取消其Blackwell芯片与GraceCPU、NVLink和NVSwitch的捆绑销售,这意味着新的GB300设计可以采用x86CPU和Broadcom的PCIe交换机。同时,将提供参考设计,但允许CSPs/ODMs进行更多定制。
6.互联方面,英伟达将在GB300服务器上导入新一代ConnectX-8SuperNIC和理论带宽翻倍的1.6Tbps光模块。
7.GB300AI服务器液冷散热需求更强。据此前报道,新一代GB300AI服务器将采用“BlackwellUltra”架构,由于性能显著提升,导致功耗也大幅增加,因此将采用全液冷散热方案。不过来自WccfTech的消息源称,全液冷方案也推高了服务器成本,预计GB300服务器的顶配价格将远超目前约300万美元(当前约2196.6万元人民币)的GB200NVL72服务器。
8.超级电容具有成为服务器主流电源方案的优势。与传统的带电池的UPS系统相比,超级电容在调频、弥补电力缺口、负载平衡和能量回收等方面具有显著优势。这些特性使其在断电或负载高峰期间能够快速释放能量,保证不间断供电,并提高能源效率。
GB300升级带来的投资机会,主要体现在光模块、散热、电源、铜连接、测试、PCB等环节。
液冷:英维克;
电源:麦格米特;
AEC有望在ScaleUp兴起的趋势下获得越来越多的市场空间:瑞可达、兆龙互连、博创科技、中际旭创、澜起科技;
测试:淳中科技。
超级电容:江海股份
参考资料:
20250105-浙商证券-GB300升级的投资机会
20241229-华福证券-科技:LightCounting乐观展望铜缆&CPO市场,GB300更多细节曝光
20241211-中泰证券-超级电容:产业趋势明显,服务器或成超级电容应用新方向
20250107-东吴证券-辨析ScaleOut与ScaleUp与AEC在光铜互联夹缝中挤出市场的What、Why、How
投资顾问:王德慧(登记编号:A0740621120003),本报告中的信息或意见不构成交易品种的买卖指令或买卖出价,投资者应自主进行投资决策,据此做出的任何投资决策与本公司或作者无关,自行承担风险,本公司和作者不因此承担任何法律责任。
免责声明
以上内容仅供您参考和学习使用,任何投资建议均不作为您的投资依据;您需自主做出决策,自行承担风险和损失。九方智投提醒您,市场有风险,投资需谨慎。
相关股票
相关板块
相关资讯
扫码下载
九方智投app
扫码关注
九方智投公众号
头条热搜
涨幅排行榜
暂无评论
赶快抢个沙发吧