OpenAI 发布OpenAI o1-preview,该模型在回答问题前先进行思考,即引入强化学习算法产生一个比较长的内部推理(思维链),可以将复杂任务一步步拆解,给出更加准确的答案。与之前的模型相比o1 提升了大模型在推理方面的能力,可以处理如数学、代码、科学等方面更加复杂的任务。
相比gpt,o1 更侧重Post-Training。就像人类在回答难题之前可能会思考很长时间一样,o1 在尝试解决问题时也会使用思维链(CoT)。o1 通过强化学习能够打磨自己的思维链,并改进自己使用的策略;可以识别并纠正自己的错误;能做到将复杂的步骤分解为更简单的步骤;并实现在现有方法不起作用时尝试不同的方法。这一过程极大地提高了模型的推理能力,在很大程度上解决了以往大模型在逻辑推理方面的不足。
o1 有望带动推理算力需求提升。OpenAI 发现随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算), o1 的性能也在不断提升。Post-Training的Scaling Laws 成为新的值得重点关注的方向,推理环节的算力需求上限被大幅提升。o1 表明推理阶段对于复杂问题的解决起到非常关键的作用,因此未来推理端算力可能非常重要,甚至可能比Training 端算力更加重要。未来算力投资也可能更多转向推理阶段。
o1 提供更多可训练数据,加速大模型产业发展。由AI 生成数据的可靠性提升,解决了训练下一代大模型数据不足的问题。目前训练新的大模型不可避免的要用到AI 生成的数据,但是生成式AI 往往存在“幻觉”,在逻辑推理方面输出的信息准确度并不高。而o1 大模型能够在科学问题和逻辑推理方面生成更加可靠的答案,能够为训练能够充分理解现实世界的AGI 提供可靠数据。
o1 拓宽大模型应用领域,带来新增需求。首先,o1 拓宽人工智能的应用范围。
以往AI 很难解决一些推理方面的复杂问题,因此商业化应用局限于通用的消费者市场。而本次OpenAI 新模型o1 对于一些复杂问题回答的表现非常好,未来可能在科研、医疗等复杂应用场景中具有很大的应用潜力。其次,OpenAIo1 有望提供新的AGI 路径,scaling law 的拓展在post-training 侧也有更多的提升空间,这也一定程度上影响着未来模型的设计思路与发展方向。
投资建议:OpenAI o1 推理端算力需求增长拉动硬件基础设施建设需求。建议关注:1、光通信产业链【中际旭创】、【新易盛】、【天孚通信】等;2、scaling law 未失效,集群规模扩大,networking Capex 占比持续提升,利好交换机产业链【盛科通信】、【紫光股份】、【中兴通讯】、【锐捷网络】、【菲菱科思】等;3、IDC 产业链算力基础设施供需格局持续改善【万国数据】、【润泽科技】、【世纪互联】、【奥飞数据】等;4、海外AI 算力基础设施龙头【英伟达】、【博通】、【Arista】等;
风险提示: o1 模型落地进度不及预期,实际应用效果不及预期,行业竞争格局恶化。