核心观点:
向量数据库是开发和应用AI 大模型过程中的必备的软件基础设施。向量数据库是专门用于存储和管理向量数据,其具备的快速检索、混合存储、向量嵌入等能力很好的解决了AI 大模型技术中普遍存在的知识时效性低、输入能力有限、回答问题准确度低等问题。我们认为,向量数据库是开发和应用AI 大模型过程中必备的软件基础设施。
从实际应用案例来看,向量数据库在AI 大模型的训练和推理过程中降本增效的效果已有所显现。ChatGPT Plugins 外接向量数据库,不仅大大拓展了AI 大模型交互信息的范围,还保护了用户隐私。Qdrant 向量数据库与Pienso 合作,已经实现在开源AI 大模型的基础上开发私域大模型。我们认为,随着微软365 Copilot 以及ChatGPT 企业版等标杆产品的落地,AI 应用的发展正逐步由点扩散到面,各领域智能化升级的快速进展将大大增强向量数据库等相关产品的成长确定性。
向量数据库行业有望随各行业智能化升级而快速成长。在商业化方面,向量数据库行业还处于市场培育期,Zilliz、Pinecone 和腾讯云均推出免费版本的产品给用户试用。我们认为,向量数据库的实际应用效果得到用户充分认识后,产品拓展过程有望加速,各行业用户付费意愿有望提升。未来,向量数据库商业化的节奏取决于各行业客户使用AI 大模型的实际需求以及其在AI 大模型技术中应用的实际效果。
向量数据库作为新型技术,发展时间较短,开源和上云是目前的主流趋势。该领域早期的探索,主要是以Zilliz、Pinecone 等初创型公司引领,普遍采用开源的形式培育社区生态,以及上云的方式扩大用户覆盖面。近期,以腾讯云、华为云和星环科技为代表的厂商在非结构化数据处理具有一定技术积累的基础上,也于近期推出了向量数据库产品。
向量数据库整体处于新兴市场起步阶段,产品的快速渗透对同行竞争者影响有限。我们认为,向量数据库整体处于新兴市场起步阶段,行业参与者往往能够凭借具有竞争力的产品实现从0 到1,再到一定市场份额的发展,能够享受更多下游快速渗透带来的机会,而同行竞争带来的压力相对较小。下一阶段,向量数据库的产品化和商业化是各厂商成长的关键。未来,针对各场景需求特点,结合AI 大模型的能力开发出满足行业用户需求的向量数据库产品,以及根据实际产业趋势制定合理的收费模式将是各厂商在低渗透率的环境下获客的关键。
投资建议:推荐星环科技。
风险提示:商业化落地受下游应用拉动,兑现尚需时间;科技巨头在向量数据库领域的布局可能导致行业竞争加剧;技术开源导致中小企业入局向量数据库领域。