事件:
根据X,OpenAI 于2 月16 日发布首个文生视频大模型Sora。
点评:
OpenAI 首个视频生成模型上线,最长可生成60s 视频。Sora 可以直接输出长达60 秒的视频,并且包含高度细致的背景、复杂的多角度镜头。
1)Sora 采用了扩散模型技术,不仅能够一次性生成完整的视频,还能延长已生成的视频。2)Sora 可实现同一视频中设计多个镜头,并保持角色和视觉风格的一致性。而此前的视频生成的都是单镜头。3)在数据方面,OpenAI 将视频和图像表示为patch,类似于GPT 的token。通过这种统一的数据表示方式,可以在比以前更广泛的视觉数据上训练模型。
Sora 是构建世界模型的基础,该功能有望成为通向AGI 的重要里程碑。
技术报告显示,OpenAI 并不是把Sora 单纯当作一个视频模型来看待,而是将视频生成模型作为“世界模拟器”,不仅可以在不同设备的原生宽高比直接创建内容,还能展示出对真实世界的模拟能力,如3D 一致性、长期一致性和对象持久性等。OpenAI 表示,“我们最大的模型 Sora 能够生成一分钟的高保真视频。我们的结果表明,扩展视频生成模型是构建物理世界通用模拟器的一条有前途的途径。”长期算力增速确立,建议关注算力侧及应用侧。文生视频赛道玩家逐渐丰富,如pika、runway 等。1)从应用角度而言,Sora 的出现可能加速影视行业的降本增效过程,比如使用AI 制作高风险或者特效镜头、用AI 制作歌曲MV 等。2)从数据量角度看,由于视频和图像的数据量远大于文本,生成视频所需的算力和存储空间比文字更高,因此文生视频模型的发展将扩大全球对于算力的需求。
建议关注,1)算力:海光信息、寒武纪、神州数码;2)服务器:工业富联;3)PCB:沪电股份、胜宏科技、深南电路、生益科技;4)载板:
兴森科技;5)交换设备:盛科通信、菲菱科思;6)文生视频:万兴科技(计算机组覆盖)
风险提示:下游应用不及预期;技术进展不及预期;