AI动态跟踪：多模态模型和应用涌现 24年产业进展的下一“高地”

行业近况

我们观察到近期AI多模态领域在新技术和新产品上有较多进展，多模态相关模型方面的新进展CoDi-2、Stable Diffsion Video、Meta的Emu Edit和Emu Video，应用端Pika推出、Runway Gen-2 功能更新，创意软件AdobePhotoshop、Wondershare Filmora等更多AI功能的发布等。展望2024年，我们认为多模态会是整个产业关注的又一大焦点。

学术界热点持续：从2022 年开始，多模态就已经成为AI学术界较为关注的领域，我们判断下一阶段研究的重点仍将是探索统一泛化的多模态大模型，以及多种模态之间的复杂交互，我们观察到近期UC Berkeley、微软等研究者提出CoDi-2 模型，支持any-to-any多模态生成（文+图+图生成图、文+声+图生成图、文+图+图生成声等），融合多模态的混合交互、生成在算法端持续进展；在视觉相关的领域（图像、视频等）学术界近期进展较多，我们观察到Stability AI、Meta等厂商均推出最新的文生视频模型。

产业界或出“爆款”：从过去一年来看，多模态领域的生成式AI应用往往具有更强的“出圈”效应和成为流行产品的潜质（效果更为直观，传播度强）。展望2024 年，我们预计生成式AI领域下一个流行应用也有望出现在多模态领域，多模态也会是OpenAI等AI厂商下一步模型迭代的重点方向。

我们观察到近期Pika、Runway Gen-2、HeyGen等文生视频、AI视频配音等应用收获较多关注度，而Adobe Photoshop、Wondershare Filmora等创意软件再迎AI赋能下的功能升级。

AI多模态技术产品持续进展，看好多模态AI应用商业变现前景。我们认为面向C端的图片生成、视频生成等多模态应用中AI实现的功能较为直观，看好多模态AI应用商业变现前景：1）对新兴AI应用厂商而言，高活跃用户数的AI应用产品有望持续快速出现，助力其商业化探索以及关注度提升；2）对成熟创意软件而言，AI带来的功能升级效果显著，看好AI赋能带来的C端创意软件付费渗透率提升和AI增量功能持续提价空间。

估值与建议

维持行业内覆盖公司的盈利预测、估值和目标价不变。持续推荐AI应用赛道中的各细分龙头，重点关注多模态领域。

风险

技术进展不及预期；应用落地不及预期；行业竞争加剧。

行情