观点聚焦
投资建议
年初以来,ChatGPT所展现出的生命力与创造力使世界为之侧目,几次迭代都牵动着市场关注的焦点。相较原先“大炼模型”时代下各厂商在各自赛道迭代的自家小模型,大模型较强的泛化能力以及丰富的生成内容,使一个问题自然被抛出:行业范式是否会从“大炼模型”转向“炼大模型”,由大模型赋能呢?与市场普遍看好大模型不同,我们认为,大小模型各有优劣,未来,大小模型有望协同促进,共同赋能生产、生活的方方面面。
理由
大模型彰显“暴力美学”,小模型专精细分领域。1)大模型:大模型之大,体现在语料规模大、参数规模大。自Transformer之后,大模型参数规模由1亿个(2017 年)指数级上升至万亿个(2021 年)。可以说,大模型的迭代是一场“暴力”填数据、拔规模而造就的“美学盛宴”。2)小模型:与大模型相比,小模型的训练数据量与参数量较少,其优势在于“专精”,可满足特定任务需求。我们认为, AI模型当前仍以小模型为主,赋能安防、消费、金融、工业等众多行业。
我们判断,未来大小模型的关系并非取代,而是协同促进,核心原因在于两者各有优劣。虽然大模型泛用性较强,所生成内容媲美人类水平,具备突现能力并处在快速迭代中;但是其高昂的成本、较大的能耗令人难以忽视。我们测算,GPT-3 训练所需算力成本约1,200 万美元,所产生二氧化碳排放量达362 吨,对厂商的资金压力以及训练当地的环境压力较大。而小模型尽管泛用性较弱,但贴近真实场景(具备行业know-how),且算力要求低、能耗小,一些厂商的数据保护意识较高,都使得小模型仍会在诸多场景具有优势。
具体来看,1)大模型促进小模型:大模型能够通过压缩技术向小模型输出知识能力;或从大模型中抽取小模型,以轻量化的小模型向下游场景赋能。2)小模型促进大模型:小模型可作为教师模型加速大模型收敛,或作为样本价值判断模型帮助大模型迭代,增强大模型的行业知识积累。
展望产业结构格局演化,我们认为短期受政策法规、配套设施的不完善,大模型的商业化落地仍属早期,小模型仍是主力;但随着各环节发展,大模型有望成为“发电机”般的重要算法基础平台。我们认为,软硬件环节都有望受益于人工智能行业的发展。
估值与建议
我们维持所覆盖公司盈利预测不变。
风险
大模型发展与小模型应用落地不及预期。