行情中心 沪深京A股 上证指数 板块行情 股市异动 股圈 专题 涨跌情报站 盯盘 港股 研究所 直播 股票开户 智能选股
全球指数
数据中心 资金流向 龙虎榜 融资融券 沪深港通 比价数据 研报数据 公告掘金 新股申购 大宗交易 业绩速递 科技龙头指数

AI浪潮之巅系列:CHATGPT之后 大小模型如何推演?

中国国际金融股份有限公司 2023-04-04

观点聚焦

投资建议

年初以来,ChatGPT所展现出的生命力与创造力使世界为之侧目,几次迭代都牵动着市场关注的焦点。相较原先“大炼模型”时代下各厂商在各自赛道迭代的自家小模型,大模型较强的泛化能力以及丰富的生成内容,使一个问题自然被抛出:行业范式是否会从“大炼模型”转向“炼大模型”,由大模型赋能呢?与市场普遍看好大模型不同,我们认为,大小模型各有优劣,未来,大小模型有望协同促进,共同赋能生产、生活的方方面面。

理由

大模型彰显“暴力美学”,小模型专精细分领域。1)大模型:大模型之大,体现在语料规模大、参数规模大。自Transformer之后,大模型参数规模由1亿个(2017 年)指数级上升至万亿个(2021 年)。可以说,大模型的迭代是一场“暴力”填数据、拔规模而造就的“美学盛宴”。2)小模型:与大模型相比,小模型的训练数据量与参数量较少,其优势在于“专精”,可满足特定任务需求。我们认为, AI模型当前仍以小模型为主,赋能安防、消费、金融、工业等众多行业。

我们判断,未来大小模型的关系并非取代,而是协同促进,核心原因在于两者各有优劣。虽然大模型泛用性较强,所生成内容媲美人类水平,具备突现能力并处在快速迭代中;但是其高昂的成本、较大的能耗令人难以忽视。我们测算,GPT-3 训练所需算力成本约1,200 万美元,所产生二氧化碳排放量达362 吨,对厂商的资金压力以及训练当地的环境压力较大。而小模型尽管泛用性较弱,但贴近真实场景(具备行业know-how),且算力要求低、能耗小,一些厂商的数据保护意识较高,都使得小模型仍会在诸多场景具有优势。

具体来看,1)大模型促进小模型:大模型能够通过压缩技术向小模型输出知识能力;或从大模型中抽取小模型,以轻量化的小模型向下游场景赋能。2)小模型促进大模型:小模型可作为教师模型加速大模型收敛,或作为样本价值判断模型帮助大模型迭代,增强大模型的行业知识积累。

展望产业结构格局演化,我们认为短期受政策法规、配套设施的不完善,大模型的商业化落地仍属早期,小模型仍是主力;但随着各环节发展,大模型有望成为“发电机”般的重要算法基础平台。我们认为,软硬件环节都有望受益于人工智能行业的发展。

估值与建议

我们维持所覆盖公司盈利预测不变。

风险

大模型发展与小模型应用落地不及预期。

免责声明

以上内容仅供您参考和学习使用,任何投资建议均不作为您的投资依据;您需自主做出决策,自行承担风险和损失。九方智投提醒您,市场有风险,投资需谨慎。

推荐阅读

相关股票

相关板块

  • 板块名称
  • 最新价
  • 涨跌幅

相关资讯

扫码下载

九方智投app

扫码关注

九方智投公众号

头条热搜

涨幅排行榜

  • 上证A股
  • 深证A股
  • 科创板
  • 排名
  • 股票名称
  • 最新价
  • 涨跌幅
  • 股圈