Scaling law 下算力需求持续扩张,基础硬件端将充分受益OpenAI 的Scaling Law 下,模型有效性和计算约束正相关。因此在GPU 能力一定的情况下,如何提高集群的线性加速比,满足低时延、大带宽、无阻塞的机间通信,从而降低多机多卡间数据同步的通信耗时,成为模型训练侧新的核心议题。根据英伟达的财报后电话会,黄仁勋认为推理需求在当下被极大低估。当下大模型企业把更多的精力都花在提升大模型智能水平,因此绝大部分算力都被用在于训练。但随着模型迭代逐步放缓及更多AI 应用的落地,推理侧的需要也在快速增加。
IB 胜在性能、以太网优在开放,看好AI 推动的量、速双增IB 协议由于源生的RDMA 技术,从而天然的具有低时延高性能的特征,在AI 训练侧有更好的应用。而推理侧的需求方面,具有成本及开放性优势的RoCE 协议或将更占优。
IB 的网络硬件格局相对封闭,核心供应商Mellanox 具主要份额。
GB200 的新架构通过充分提升单芯片的算力密度、应用散热效率更高的液冷方式,实现了在更小的空间内部署更多的GPU 卡,使铜缆连接成为机柜内连接新需求。以太网设备国内供应商参与相对充分,从上游交换芯片到中游的制造和品牌商均有覆盖。在数据中心市场为核心驱动的大背景下,中游的品牌商格局相较制造商更为集中,同时由于互联网厂商对于数据安全及硬件可编程性的重视,自组网的白盒硬件有望持续受益;上游原材料中,芯片的BOM 成本占比高,交换芯片作为原材料核心,具有天然的技术、资金壁垒,同时盈利能力高度依赖出货规模,需警惕部分自用厂商在该方向的垂直整合程度深化。
投资建议
受益于智算数据中心的推动,网络硬件的需求持续提升。以太网架构的网络硬件随着海外巨头的布局市场重视度强化,我们认为随着国产算力链的迭代升级,以太网交换机链亦将深度受益。看好产业链上游交换芯片核心供应商盛科通信;网络设备商锐捷网络、紫光股份、菲菱科思、星网锐捷、共进股份。
风险提示
国际贸易摩擦加剧与宏观经济环境波动的经营风险、下游行业发展不及预期、客户相对集中度高的风险、行业竞争加剧风险