核心观点
以ChatGPT 为代表的生成式AI 算法取得突破,其通用性能力帮助人类在文字等工作上节省了大量时间,在Transformer 新架构下,多模态大模型也取得新的突破,文生图、文生视频等功能不断完善。大模型作为将来重要的基础技术底座,将创造巨大的商业价值,同时也要关注数据要素的重要性。在AI 大时代下,我们重点关注算力和应用的相关投资机会,算力端,建议关注英伟达、AI 服务器、光模块、液冷等领域,以及国产算力替代机会。
在应用端,建议关注海外业务占比高的应用相关公司,以及能够通过大模型有效实现降本增收的相关公司。
摘要
生成式AI 算法取得突破,实现了从0 到1。自2022 年底OpenAI正式推出ChatGPT 后,用户量大幅增长,围绕ChatGPT 相关的应用层出不穷,其通用性能力帮助人类在文字等工作上节省了大量时间。同时在Transformer 新架构下,多模态大模型也取得新的突破,文生图、文生视频等功能不断完善,并在广告、游戏等领域取得不错的进展。生成式AI 算法将是未来几年最重要的生产力工具,并深刻改变各个产业环节。
海内外大模型加速推进。以OpenAI 为代表,基于Transformer模型开辟自回归建模路径,随后发布了GPT 系列模型,随着GPT模型爆发出强大的应用潜力,OpenAI 也开始其商业化布局。微软23Q3 财报显示,FY23Q3 Azure OpenAI 已有2500 个服务客户,Azure 云下个季度中有1%的收入增长来自于人工智能,随着生成式AI 应用的不断普及,算力需求开始快速增长。谷歌方面,其在模型算法、算力芯片、应用场景等多个环节均有完整布局,并且首次将Transformer 应用于CV 领域—ViT 算法,23 年4 月,谷歌推出了ViT 的220 亿参数量的版本,和GPT-2 到GPT-3 的变化趋势相似,其具备了强大的Zero-shot 图像分类泛化能力,CV领域也将迎来大模型时代。Meta 也是AI 领域重要玩家之一,旗下模型包括OPT、LLaMA、SAM、DINOv2,同时Meta 也在不断开源其大模型,进一步加速产业发展。国内,包括百度、阿里、三六零、天工、商汤、科大讯飞也都在不断推进自己的大模型,相关模型已有不少进行开放性测试,整体上已经处于GPT3 至GPT3.5 之间的水平,随着模型进一步迭代,国内大模型距离商业化已经越来越近。
技术演进趋势:多模态大模型蓬勃发展。Transformer 颠覆了传统深度学习模型,不局限于文本,ViT 打通了Transformer 与CV 领域的壁垒, BEiT 模型将生成式预训练引入CV 领域,基于ViT 的多模态模型涌现。现有的多模态预训练大模型通常在视觉和语言两种模态上进行预训练,未来可以获取更多模态进行大规模预训练,包括图像、文本、音频、时间、热图像等,基于多种模态数据的预训练大模型具有更广阔的应用潜力。其次,未来多模态大模型将走向“真正统一”。以微软KOSMOS-1 为代表,将图像、音频进一步编码成文本格式,统一成文本进行融合。
多模态已经在多个领域中得到广泛应用,各式应用持续推动多模态模型的演进。
大模型公司(包括多模态大模型):大模型作为将来重要的基础技术底座,可以通过会员订阅费、API 许可费进行收费。根据路透社报道,OpenAI 在2022 年收入数千万美元,并预计2023、2024 年收入为2 亿、10 亿美元。随着应用以及用户越来越多,大模型公司将呈现高速增长,尤其是重点关注大模型公司中有业务场景的。
重点关注:科大讯飞、商汤、昆仑万维、三六零。
数据要素卖给大模型:以Reddit 为代表,开始准备向使用他们数据的大模型公司进行收费。另外,欧盟的《人工智能法》协议要求开发ChatGPT 等生成式人工智能工具的公司必须披露他们是否在系统中使用了受版权保护的材料。数据质量和体量决定了大模型的优劣,展望未来,围绕着数据产权将有进一步的价值划分,重点关注:
同方股份(知网)、中国科传(万方)和部分中文小说网站公司。其次多模态大模型的背景下,视频未来也有望可以卖给大模型公司。
大模型+专业数据要素+细分行业:主要在B 端,部分公司拥有行业中非公开的、高价值的专业化数据,结合大模型能力,增加客户服务范围和ARPU 值。由于龙头公司手中数据更多,并且行业卡位明显,结合AI 的产品有望进一步构筑行业龙头壁垒。
算力公司:算力的需求来自三方面:模型越来越大+渗透率加速提升+技术演进。第一,模型参数量越大,推理效果越好,单个大模型对于算力需求随着参数量增长而增长;第二,各家都开发大模型,训练需求大幅增长,之后大量的应用部署,推理需求进一步爆发;第三,文生图、文生视频的需求,每增加一个维度,算力需求就进一步增加。重点关注:英伟达、英伟达供应链中的AI 服务器(浪潮信息、工业富联)、光模块、液冷等领域。
国产算力替代:各地加速推进智算中心,国产AI 芯片进行国产替代,重点关注寒武纪、海光信息、华为昇腾供应链等。
海外应用:海外业务占比高,跟Chatgpt 率先结合,创造出新应用,万兴科技、福昕软件均有跟生成式AI 结合的产品推出,并取得了不错的效果。
国内应用(降本线):生成式AI 能很好地节省人力,典型的如广告、影视等领域,可以显著降低成本,而且降本节奏最快,目前在电商、广告、游戏、影视等领域都可以看到生成式AI 应用后所带来的成本降低。
国内应用(增收线):产品壁垒较高的公司,在接入大模型后,提升用户数量以及增加ARPU 值,重点关注金山办公、同花顺等。
风险提示:国际环境变化影响供应链及海外拓展;芯片紧缺可能影响相关公司的正常生产和交付,公司出货不及预期;疫情影响公司正常生产和交付,导致收入及增速不及预期;信息化和数字化方面的需求和资本开支不及预期;市场竞争加剧,导致毛利率快速下滑;主要原材料价格上涨,导致毛利率不及预期;汇率波动影响外向型企业的汇兑收益与毛利率;人工智能技术进步不及预期;人工智能技术可能存在伦理风险;汽车与工业智能化进展不及预期等;半导体扩产不及预期。