投资事件:2023 年3 月16 日下午14 时,百度召开发布会发布文心一言大模型。发布会上,百度用视频方式演示了文心一言的五大应用方向,并表示用户可以采用邀请码的方式进行体验,同时API 将向生态合作伙伴开放预约。3 月16 日晚,百度向公众开放了公测预约通道。
文心一言主要有五大应用方向,展现出了多模态的语言、图像、语音和视频生成能力。
文心一言的应用方向有文学创作、商业文案创作、数理逻辑推算、中文理解和多模态生成。发布会中,百度演示了文心一言依次生成文案、海报、将文案转换为四川话语音以及生成宣传视频的能力。其中,视频生成的能力已经被应用在了百家号的创作中。我们认为,从百度展示出的demo 来看,文心一言已经具备了一定的多模态生成能力,特别是中文的生成和理解上已经达到了不错的水准,展现出了商业价值。
文心一言的训练使用到了百度自研的三项训练技术,发挥了搜索引擎技术积累优势。文心一言的训练除了采用GPT 模型训练使用到的fine-tuning、RLHF 和prompt 之外,还有结合了搜索引擎技术的知识增强、检索增强和对话增强技术。我们认为,百度作为中文搜索引擎的龙头有大量积累的技术能力,且能够以低成本获取大量语料数据,未来有望全方位提升文心一言的模型能力。
百度进行全栈技术布局和协同优化,有望成为大模型降本的有效方案。百度进行了全技术栈的AI 布局,有芯片层的昆仑芯、框架层的飞桨、模型层的文心和应用层的搜索引擎等。生成式AI 有极大的算力需求,百度的全栈布局可以做到四层架构之间的协同优化,从而达到降本增效的作用。我们认为,大模型训练和推理成本过高的问题依旧是阻碍下游应用的重要因素。随着国产硬件性能的持续提升,软硬件全栈布局和协同优化或将成为大模型降低成本的可行方案。
大模型带来MaaS 产业机会,下游行业需求或将引领模型迭代方向。据百度介绍,大模型带来了MaaS(Model as a Service)、行业模型精调和应用开发三大产业机会;AI市场迎来了爆发式的需求增长,已经有650 余家伙伴加入了文心一言生态。我们认为,目前的大模型还处于开发和测试阶段,其商业模式尚不成熟。文心一言开放API 后,B端行业客户可以根据需求对模型进行应用和开发,业内的高质量数据也可用于模型训练,形成良好的生态循环。在MaaS 的商业模式下,行业应用的需求或将指引未来大模型的迭代方向,相关AI 应用产品有望加速落地。
投资建议:我们认为,文心一言表现出了一定的多模态生成能力和应用价值。百度软硬件全栈布局的方式或将成为大模型成本降低的可行解决方案,应用层需求或将指引模型的迭代方向。建议关注模型层开发标的,如科大讯飞、格灵深瞳;底层算力芯片和服务器等硬件支持标的,如寒武纪、海光信息、浪潮信息、中科曙光;数据标注和数据集建设标的,如海天瑞声;百度生态合作伙伴相关标的,如宇信科技、京北方、彩讯股份。
风险提示:技术落地速度不及预期,竞争加剧等