特斯拉超级计算机7 月投产。根据财联社报道,特斯拉AI 团队在Twitter发布了超级计算机平台Dojo 的产品进展时间线,该计算机于23 年7 月投产,并表示到2024 年初,Dojo 将成为全球最先进的5 台超级计算机之一。
AI 垂直细分领域算力也有望进入快速增长期。特斯拉AI 表示,2024 年2月特斯拉算力规模有望进入全球前五,2024 年10 月特斯拉的算力总规模将达到100EFLOP,相当于30 万块英伟达A100 显卡的算力总和。根据特斯拉,Dojo 超级计算机可加速特斯拉的Autopilot 和完全自动驾驶(FSD)系统的迭代,还能为特斯拉的人形机器人Optimus(擎天柱)提供算力支持。
特斯拉算力集群饱和度较高,未来有望加速迭代。根据特斯拉统计,每个Dojo 都集成了120 个训练模块,内置3000 个D1 芯片,拥有超过100 万个训练节点,算力达到1.1EFLOP。特斯拉同时计划在Palo Alto 数据中心部署7 个由Dojo 系统机柜组成的集群。同时特斯拉工程总经理也表示,当前特斯拉计算集群仅有0.3%空闲空间,其中84%工作是高优先级。我们认为当前特斯拉在智能汽车领域打响了AI 训练的“第一枪”,未来自动驾驶、自动泊车、智能网联的发展有望为数据中心提供较为广阔的产业机会。
芯片级液冷重要性不言而喻。根据电动星球梳理,单个Dojo Tile 上布有25块D1 芯片,保守估计功耗也超过了10kW。为解决芯片散热问题,特斯拉采用的解决方案类似于电脑的“分体水冷主板”,即用垂直水路将芯片、供电元件连接起来,用少量的水路解决多个散热需求。当前行业内已有多个公司提出对应解决方案,当前工业富联推出高性能高密度浸没式模块化服务器,并携手阿里巴巴,通过产品技术的不断迭代升级实现浸没式液冷低功耗、低成本、易运维的目标。
投资建议:我们认为当前AI 已逐渐在垂直应用领域内落地开花,算力需求量有望进一步上升,建议关注在AI 服务器内拥有技术壁垒及客户壁垒公司如工业富联、共进股份、中兴通讯、紫光股份。同时我们认为大模型训练的参数多、循环次数多,单次训练的算力需求大,我们认为算力调度可协助GPU 实现算力资源优化,一定程度上解决大模型GPU 训练资源不足的掣肘,建议关注AI 训练可视化公司恒为科技。同时我们认为随着智算中心落地,以曙光数创为代表的芯片级液冷技术有望得益于适配芯片生态快速放量相应解决方案,建议关注曙光数创、申菱环境、英维克。
风险提示:大模型进展不及预期,算力需求不及预期,资本开支压力。