导语
①英伟达第四季度业绩超预期,净利润122.85亿美元,同比增长769%;
②OpenAI发布文生视频模型Sora,可以将文本快速制作长达一分钟的视频。
事件驱动
英伟达第四财季收入221亿美元,同比增长265%,分析师预期204.1亿美元;净利润122.85亿美元,同比增长769%。英伟达预计第一财季收入240亿美元,上下不超过2%,分析师预期为219亿美元。英伟达表示,对下一代产品的需求远远超过供应。
OpenAI发布首个文生视频模型Sora,效果震撼。Sora模型可以通过文本描述生成60秒长视频,还可以对视频色彩风格等要素精确理解,创造出人物表情丰富、情感生动的视频内容。Sora三大亮点突出,实现AIGC领域的里程碑式进展。首先是60秒长视频,Sora可以保持视频主体与背景的高度流畅性与稳定性。其次是单视频多角度镜头,Sora在一个视频内实现多角度镜头,分镜切换符合逻辑且十分流畅。再是理解真实世界的能力,Sora对于光影反射、运动方式、镜头移动等细节处理得十分优秀,极大地提升了真实感。
Sora模型推动AI多模态领域飞跃式发展,AI创作等相关领域将迎来深度变革,AI赋能范围进一步扩大,多模态相关的训练及推理应用也将进一步提升对算力基础设施的相关需求。
行业透视
多模态:AGI必经之路与商业宏图起点。
相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现的更加智能,能够执行更大范围的任务,有望成为人类智能助手,推动AI迈向AGI。就技术架构而言,多模态技术可拆解为编码、对齐、解码与微调等步骤,逐步挖掘多模态关联信息,输出目标结果。
文生图CLIP模型为最先成熟的多模态技术,目前,多模态已不再局限于图文两层信息。例如,Meta-Transformer可同时理解并处理12种模态信息。
(来源:东吴证券)
OpenAI推出首款视频生成模型Sora,视频更加接近真实世界。
美国当地时间2月15日,OpenAI发布视频生成模型Sora,是一种通用的视觉数据模型,可以生成持续时间、宽高比和分辨率各异的视频和图像,长达一分钟的高清视频更加接近真实世界。Sora是一种扩散模型,生成的视频一开始像静态噪音,之后通过多个步骤去除噪音,逐步转换视频。
与Midjourney和Stable Diffusion同样基于扩散模型相比,Sora生成视频的质量更高,更像是创建了真实的视频。而与Gen-2、SVD-XT、Pika等主流产品相比,Sora可生成最长一分钟的视频,具备更强的构建物理世界的模拟能力。
(来源:华福证券)
一般在同样信息量情况下,文字数据量<图片数据量<视频数据量,多模态大模型需处理的数据量更大,再加上训练工程上难点更多,对应算力需求更高。参考前深度学习时代向深度学习时代过渡,以及从“大炼模型”进入“炼大模型”切换之后,算力需求均有明显提升。
根据机器之心,谷歌Gemini有万亿参数,训练动用的算力是GPT-4的五倍。未来随着算力需求的进一步提升,芯片制造、提供云服务以及模型微调的企业有望迎来更多发展机会。
(来源:东吴证券)
与此同时,国内科技公司积极研发国产大模型,互联网大厂在数据积累与算法水平兼具优势,率先切入多模态大模型赛道,其后不断涌现大模型科技公司与初创公司,在多模态大模型领域持续投入同时陆续更新大模型能力。
例如,百度2023年3月发布文心一言,成为全球大厂中第一个对标ChatGPT甚至是GPT-4的大模型,同时具备文字生成图片、音频(方言)、视频等多模态能力。其后,阿里巴巴、腾讯等互联网大厂,商汤科技等大模型公司以及智源研究院、智谱等初创公司或研究所均发布了国产多模态大模型,并通过不断迭代实现能力突破,逐步缩小与海外大模型差距。
(来源:东吴证券)
东吴证券认为,随着多模态技术迭代,图像生成、视频生成、3D生成、音频生成等AIGC应用有望加速;后续MR+AI技术共振更有望共同驱动下一代生产力工具及文娱体验升级。
在多模态方向已有布局或具备布局能力的标的:昆仑万维(模型能力国内领先,正进行多模态研发及布局)、万兴科技、美图,建议关注新国都。
多模态技术进步利好电商、游戏、教育、营销等领域AI应用发展,推荐焦点科技(AI+电商)、中文在线(AI+游戏、短剧等)、盛天网络(AI+游戏)、蓝色光标(AI+营销)、凤凰传媒(AI+教育)、世纪天鸿(AI+教育)等,建议关注掌趣科技(积极与行业头部厂商合作,23年6月与悠米达成业务合作,共同开发AI游戏创作平台,降低开放世界游戏的开发门槛;23年7月与行者AI达成战略合作,扩大AI游戏创作平台的技术和创新工具储备;23年11月与蓝亚laya达成战略合作,共同打造AI游戏引擎)等。建议关注受益于AI视频应用发展的多模态技术公司,如虹软科技、当虹科技等。
算力方向建议把握板块龙头投资机会,推荐中际旭创等龙头。
投资策略
中信证券研报表示,文生视频多模态模型Sora以及Gemini 1.5 Pro等优秀模型的诞生不仅反映了美国AI产业高速迭代现状,更揭示了人工智能产业未来可能的发展趋势,有望继续成为2024年科技产业发展的核心主线之一。
华福证券认为,具有算法、数据等先发优势的国产大模型厂商具备优势,同时多模态提升大模型泛化能力,多元信息环境下实现“多专多能”,在垂直领域具有广阔的应用场景和市场价值。
建议关注:1)AI+多模态:万兴科技、中科创达、虹软科技、当虹科技、大华股份、海康威视、漫步者、萤石网络、汉仪股份、美图公司、云从科技;2)AI+办公:金山办公、万兴科技、福昕软件、彩讯股份、金蝶国际、泛微网络、致远互联、鼎捷软件、汉得信息,用友网络;3)AI+教育/电商/医疗:科大讯飞、佳发教育、鸥玛软件、盛通股份、光云科技、值得买、焦点科技、小商品城、润达医疗、嘉和美康、创业慧康、迪安诊断等。
个股精选
万兴科技:以多模态为主的国产创意软件龙头
国产创意软件龙头,产品线覆盖视频和图文,契合AI大模型多种模态的输出场景;视频创意产品是公司核心收入来源,万兴喵影是视频创意软件产品线中的最大单品。
中文在线:中文逍遥大模型大模型为创作者提供辅助
研发中文逍遥大模型,辅助中文作家小说创作、用于短剧剧本创作、为影视创作者提供创意灵感和创作辅助。拥有大量网文IP资源,持续为公司提供短剧剧本创意及素材。
昆仑万维:SkyAgents发布打造AI智能体
发布昆仑天工大模型,在逻辑推理、文本理解、多模态能力等多个方面均取得突破,基于天工大模型,天工AI搜索使意图识别成为可能;形成AI大模型、AI搜索、AI游戏、AI音乐、AI动漫、AI社交六大AI业务矩阵。
参考资料
20240219-国盛证券-英伟达(NVDA):百川终将归海,AI奇点到来
20240219-华福证券-计算机行业专题报告:多模态,AI大模型新一轮革命
20231218-东吴证券-多模态技术加速,AI商业宏图正启
免责声明
九方智投-投顾-何龙涛-登记编号:A0740622100005;以上代表个人观点,仅供参考,不作为买卖依据,据此操作风险自担。投资有风险,入市需谨慎