本报告导读:
大模型将彻底改变AI 模型开发模式;多模态输入将使应用场景进一步拓展,并加速模型自身的迭代;大模型能力将集中在IT 巨头手中,小企业的机会在于前端应用。
摘要:
大模型将彻底 改变AI 模型开发模式,使其能够触达更广泛的场景。
虽然对于大模型的广泛讨论源自于聊天与内容生成,但其意义远不止于此。和小模型不同,大模型通过大语料训练,获得了很多先验的“知识”,在此基础上,我们可以在大模型的基础上通过迁移学习生成小模型。相对于传统的小模型生成模式,新的模式能够大幅缩减特定模型训练所需要的算力和数据量,缩短模型的开发周期,并得到更好的模型训练效果。可以说,大模型的真正意义在于改变了AI 模型的开发模式,将模型的生产由“作坊式”升级为“流水线”。而模型开发模式的转变,将使得AI 技术能够更广泛地下沉到一些长尾场景。
多模态输入将使应用场景进一步拓展,并加速模型自身的迭代。一方面,多模态将拓展应用场景,比如模型可以通过对试卷上文字和图像的理解进行综合分析,得出题目答案,或是识别图片中的不合理元素。另一方面,多模态输入将使模型本身的能力获得增强,并解决更为复杂的问题。如同人类感知世界的过程是通过输入文本、图片、视频等各类信息实现的。根据Open AI 发布的结果,GPT-4 在处理复杂问题时的表现明显好于此前的GPT-3.5。比如在模拟律师资格考试的任务中,GPT-4 的分数落在前10%的考生中,而GP4-3.5 的分数则落在了后10%。
大模型能力将集中在IT巨头手中,小企业的机会在于前端应用。大模型的开发需要非常强的综合实力,需要具备丰富的开发资源,即人才、专利等等;同时需要非常强的大语料获取能力,为模型训练提供数据支持;还需要充沛的算力资源,这意味着巨额的硬件投入。而上述资源往往被IT 巨头掌握。对于小企业而言,其机会在于可以基于大模型的能力进行迁移学习生成针对自身应用场景的小模型,将模型能力进行行业落地。
投资建议:推荐金山办公、科大讯飞、凌志软件、虹软科技、汉得信息、格灵深瞳;受益标的商汤、云从科技、拓尔思、寒武纪等。
风险提示:AIGC 落地不及预期、GPT 发展受到强监管