行业近况
我们观察到近期AI多模态领域在新技术和新产品上有较多进展,多模态相关模型方面的新进展CoDi-2、Stable Diffsion Video、Meta的Emu Edit和Emu Video,应用端Pika推出、Runway Gen-2 功能更新,创意软件AdobePhotoshop、Wondershare Filmora等更多AI功能的发布等。展望2024年,我们认为多模态会是整个产业关注的又一大焦点。
评论
学术界热点持续:从2022 年开始,多模态就已经成为AI学术界较为关注的领域,我们判断下一阶段研究的重点仍将是探索统一泛化的多模态大模型,以及多种模态之间的复杂交互,我们观察到近期UC Berkeley、微软等研究者提出CoDi-2 模型,支持any-to-any多模态生成(文+图+图生成图、文+声+图生成图、文+图+图生成声等),融合多模态的混合交互、生成在算法端持续进展;在视觉相关的领域(图像、视频等)学术界近期进展较多,我们观察到Stability AI、Meta等厂商均推出最新的文生视频模型。
产业界或出“爆款”:从过去一年来看,多模态领域的生成式AI应用往往具有更强的“出圈”效应和成为流行产品的潜质(效果更为直观,传播度强)。展望2024 年,我们预计生成式AI领域下一个流行应用也有望出现在多模态领域,多模态也会是OpenAI等AI厂商下一步模型迭代的重点方向。
我们观察到近期Pika、Runway Gen-2、HeyGen等文生视频、AI视频配音等应用收获较多关注度,而Adobe Photoshop、Wondershare Filmora等创意软件再迎AI赋能下的功能升级。
AI多模态技术产品持续进展,看好多模态AI应用商业变现前景。我们认为面向C端的图片生成、视频生成等多模态应用中AI实现的功能较为直观,看好多模态AI应用商业变现前景:1)对新兴AI应用厂商而言,高活跃用户数的AI应用产品有望持续快速出现,助力其商业化探索以及关注度提升;2)对成熟创意软件而言,AI带来的功能升级效果显著,看好AI赋能带来的C端创意软件付费渗透率提升和AI增量功能持续提价空间。
估值与建议
维持行业内覆盖公司的盈利预测、估值和目标价不变。持续推荐AI应用赛道中的各细分龙头,重点关注多模态领域。
风险
技术进展不及预期;应用落地不及预期;行业竞争加剧。