核心观点:
事件:2 月16 日,OpenAI 发布其首个AI 文生视频大模型Sora。
底层技术层面,Sora 将视频统一编码为视觉块后进行训练,令视频生成大模型具备涌现能力。Sora 是采用Transformer 架构的Diffusion 模型。OpenAI 将视觉数据分解为视觉块(Visual patches)后训练模型,类似大语言模型中的Tokens,再通过解码器还原成视频输出,令Sora可以使用大规模、多样化的视频进行训练,涌现能力出现后视频生成能力显著提升。语言理解方面, OpenAI 开发模型为视频标注文字说明,再将文字标注和视频用于训练,让Sora 能准确按用户提示生成视频。
模型功能层面,Sora 在视频生成和编辑、语言理解、现实和虚拟世界模拟等方面实现SOTA。(1)大幅提升视频生成时长。Sora 可生成最长达60 秒的视频,远超Runway 和Pika 等现有工具。(2)实现“单视频多角度”。Sora 可在同一视频中为角色生成不同角度镜头。(3)可灵活调整视频的参数。Sora 能够生成不同尺寸的视频,也能编辑图片或视频,如制作连续循环视频、图片动态化、延长视频时间、流畅拼接视频等。(4)除了视频生成外,图像生成能力同样出色。图像最大分辨率达到2048x2048。(5)现实世界仿真和虚拟世界模拟。Sora 理解现实世界物理规律,例如角色在被遮挡后仍能持续存在、人在吃汉堡后留下咬痕。而诸如游戏的数字世界,例如Sora 可以在控制“我的世界”(Minecraft)玩家的同时,高保真地渲染游戏世界及其动态。
投资建议:相比现有文生视频模型,Sora 在多个维度实现模型能力大幅提升。B 端来看,游戏、影视、广告营销等内容行业将受益于视频生成能力提升带来的创意落地和输出效率跃升。C 端来看,将降低内容创作者的视频制作门槛,推动视频内容供给繁荣。建议关注:(1)赋能影视/动画:赋能影视和动画的内容创作,如应用于影视制作和宣发等环节,影视关注华策影视、光线传媒、柠萌影视、博纳影业等,动画关注上海电影、奥飞娱乐等。(2)赋能游戏:有望进一步将游戏内容精品化,提升优质游戏产能,关注腾讯控股、网易-S、三七互娱、恺英网络、完美世界、神州泰岳、巨人网络、盛天网络、姚记科技、吉比特、电魂网络、紫天科技、游族网络等。(3)赋能视频平台:内容生产者有望提高内容生产质量和效率,关注快手、哔哩哔哩、腾讯控股、爱奇艺、芒果超媒等。(4)赋能广告营销:赋能视频广告内容的生成,关注蓝色光标、三人行、易点天下、分众传媒等。(5)拥有优质网文/图片/视频版权的公司,关注新媒股份、捷成股份、视觉中国等,以及手握热门动漫IP 的奥飞娱乐、汤姆猫等,网文IP 的中文在线、阅文集团、掌阅科技等。(6)有AI 视频技术储备的易点天下、超讯通信等。
风险提示:模型迭代效果不及预期、商业化不及预期、内容伦理风险。