基础模型摆脱传统prompt 交互方式,实时交互凸显全新应用潜力。OpenAI 发布了新一代旗舰生成模型GPT-4o,其能力从基础的生成文本、音视频走向了实时的多模态交互,响应速度也大幅提升。实时交互不属于传统的prompt 交互,不需依赖于用户手动输入的信息,而是能够实时读取信息,让预测用户需求并主动或实时提供服务成为可能。
在WWDC 上,苹果展示的Apple Intelligence 和新版Siri 提供了屏幕感知功能,能够帮助用户完成信息提取和填写等操作。GPT-4o 等实时交互的模型能够与现有端侧设备较好契合,智能助理等应用场景或将迎来应用落地。
AI Infra 的投资思路开启从“量”到“质”、从后端向前端的转变。在产业发展的第一阶段,AI 变革在硬件层面体现为一种量变:AI 大模型的训练带来算力基础设施的海量需求,模型大规模应用带来推理算力基础设施的海量需求,两者催生了NVIDIA、AWS 等芯片和云服务厂商的投资机会。如今产业走向下一阶段,终端设备开始“标配”AI 能力,现有的硬件终端架构也在不断迭代,产业或将迎来手机和PC 的新一轮升级换代。我们也相信,随着产业know-how 的不断积累,在更远的未来还会有更加适配AI 的全新硬件形态出现。
AI 变革正在进入基础软件层“深水区”,OS 和中间件受益的确定性最强。大模型的火热是以ChatGPT 应用的诞生为起点的,因此惯性思维下我们都在等待下一个应用“爆品”的出现。AI 的变革在应用层无疑更加直观和激动人心,但回顾互联网应用发展历史就很容易看出,预测Killer APP 是极度困难的。相比预测下一个C 端的爆款应用,我们更相信确定的机会来自基础软件层的变革。
回顾计算机的发展历程,我们能够发现变革都是基础软件开始的。以MS-DOS 为代表的命令行操作系统使计算机走出实验室,拥有了第一批“程序员”用户;以Windows为代表的图形操作系统使计算机能够被普遍使用,并最终走向千家万户。但到了AI 时代,应用软件的突破第一次走在了系统软件之前。AI 拥有强大的生成能力,但能力不足以直接解决困难问题和创造价值;AI 拥有集成应用的潜力,但难以打通海量现有应用的接口。如今AI 又已能够实现实时交互,产业在等待基础软件层的解决方案,更是在等待一个更加全能和强大的个人助手。
基础软件厂商将会走向舞台中央,成为产业浪潮的核心。Chatbot 形态已经充分发挥了AI 的生成能力,但在多数应用场景难以实现有效应用;只有当微软、苹果这样的生态统治者在OS 中整合AI,基础模型的潜力才能得到充分发挥。(如GPT-4o 这样的模型只有与操作系统深度融合,成为类似Siri 的智能助手形态,用户才能享受到如读屏和实时交互等便捷功能。)从基础软件层面看,操作系统会逐步走向AI 原生。AI 将首先成为OS 的功能组件,承担一部分中间件与应用层的功能;随着产业技术逐渐进展,系统软件在设计之初将会直接集成AI 能力,成为AI 原生系统或AIOS。这种产业演进能够带来大量的开发测试和产品需求,为基础设施层(OS、中间件)公司将创造巨大的确定性机会。
投资建议:以GPT-4o 为代表的大模型迭代出了实时交互能力,与智能助理等终端应用场景较好契合,为终端带来变革机遇;从硬件层面看,基础设施的投资思路正在经历从“量”到“质”、从后端走向前端的转变,对硬件的关注从训练侧转向了终端推理侧。
从软件层面看,AI 带来的产业变革开始走向基础软件,随着对Chatbot 等AI 原生应用的追捧逐渐过去,基础软件厂商将会走向舞台中央,成为产业浪潮的核心,操作系统和中间件公司将迎来终端AI 部署和操作系统革新的市场机会。
建议关注:商汤(领先的基础模型厂商,与终端、芯片厂商合作布局端侧AI)、云天励飞(推理芯片全面布局)、萤石网络(AI 结合终端产品布局);推荐关注:中科创达(多年OS 开发经验积累,与芯片厂商深度合作)、星环科技(国产数据库领先者)。
风险提示:相关技术落地不及预期,行业竞争加剧,信息更新不及时等