投资要点
事件:2 月17 日,OPENAI 发布首个视频生成模型Sora,可实现文生视频、图生视频、扩展或补充视频等,最高可生成一分钟的高清视频,能生成具有多个角色、包含特定运动的复杂场景,表现出突破性的语义理解能力、复杂场景理解能力和一致性等。
视频生成能力显著突破,向着AGI 目标再进一步。相比行业原有视频生成模型gen2、pika 等,Sora 在语义理解能力、复杂场景理解能力、一致性以及生成视频时长等方面取得明显突破。1)模型层面,Sora 是一种扩散模型,从一个看起来像静态噪音的视频开始生成视频,通过多个步骤去除噪音,逐渐转换视频。Sora 可以一次性生成整个视频,也可以扩展生成的视频。与 GPT 模型类似,Sora 也采用了transformer 架构,模型性能随着模型规模扩大而提高。新技术路径验证有望加速行业发展,算力需求有望增加。2)训练数据层面,Sora 将视频和图像表示为更小的数据单元集合patch(类似于 GPT 中的token),通过统一数据表示方式,可在比以往更广泛的视觉数据上训练模型,包括不同的持续时间、分辨率和宽高比,最终生成的视频在这些维度也具有更高的灵活性。
OpenAI 未将Sora 单纯视作视频模型,而是将其作为“世界模拟器”,在物理世界模拟上已开始出现涌现效应,我们认为其亦有望为AI 3D 等其他多模态领域提供经验借鉴,多模态大模型有望加速发展。
建议关注Sora 带来的多模态应用发展机遇。1)视频生成技术在广告、电商等垂直领域的商用可行性大幅提高,如广告营销领域为客户提供更多的营销工具,电商领域为卖家提供相关的工具服务,已积累对应客户资源的行业玩家有望借此打开变现空间。2)创意落地的成本大幅缩减。
SORA 最高可生成一分钟的高清视频,基本达到主流短视频平台创作时长的要求,加上文字创作、文生图等技术日趋成熟,制作不同形态内容的门槛和成本大幅降低,一方面优质IP 有望降低试错成本,扩大IP 变现途径,另一方面视频生成技术成熟后可能会诞生新的AI 时代的抖音,国内市场聚焦在AI 大模型上持续投入的公司可有更大的拓展空间,海外接入外部大模型能力,发挥工具价值的公司可实现垂类场景的深耕。
3)专业内容生产方可降本增效。影视、游戏和MR 领域专业创作者可以利用先进AI 技术降本增效,如动画电影生产周期缩短,相关内容生产方有望受益。
投资建议:我们推荐在多模态方向已有布局或具备布局能力的标的,包括昆仑万维、万兴科技、美图等,建议关注新国都。头部IP 变现有望受益于视频生成技术成熟,推荐中文在线,建议关注上海电影等。多模态技术进步利好电商、营销、影视、游戏、教育、MR 等领域AI 应用发展,推荐焦点科技、蓝色光标、风语筑、盛天网络、世纪天鸿、华策影视、光线传媒等,建议关注丝路视觉、易点天下、因赛集团、虹软科技等。算力方向建议把握板块龙头投资机会,推荐中际旭创、天孚通信等龙头。建议关注可能受益于AI 视频发展的视频技术公司,如当虹科技等。
风险提示:多模态技术发展不及预期,伦理与隐私问题,商业化拓展不及预期,算力基础设施发展不及预期。