LLM 推动AI Agent 进入新阶段,AI 应用商业化或加速
AI Agent 是一种能够感知环境、进行决策和执行动作的智能实体,从发展历程看,经历了用逻辑规则和符号封装知识、快速响应环境、基于强化学习等发展阶段。随着大语言模型(LLM)的快速发展,AI Agent 在感知、记忆、规划、行动等模块方面的能力均得到了进一步的提升。我们认为LLM 推动AIAgent 进入了新阶段,与LLM 结合的AI Agent 在智能化程度、自主性方面有进一步提升的潜力,通过与终端的进一步结合,有望推动AI 应用商业化加速。
AI Agent 能力提升:感知/规划/记忆模块强化或工程化优化从AI Agent 的研究看, AI Agent 的要素基本上可以分为感知、定义、记忆、规划、行动五类模块。从AI Agent 的能力提升路径看,主要包括:1)单个模块的持续强化:感知模块的模态持续丰富、记忆模块增长上下文或提供更加丰富的数据来源、规划模块中通过CoT 或ReAct 等方式提升推理能力、行动模块补充第三方插件;2)系统性方式优化:如通过将AI 各个模块作为整体发挥作用,利用不同环境之间交互获取的跨模态数据,在物理和虚拟世界中运行等。综上,在底层模型升级+工程化方法改进的共同推进下AI Agent的性能有望持续提升。
Agent 自动解决固定范式的问题,关注Agent Workflow基于LLM 的Agent 实践已经取得一定的成果,从AutoGPT、GPTs、Devin等案例中可以看出,当前Agent 将LLM 应用于信息检索、工具学习、任务分解、垂直知识学习、人机交互等场景,实现了能力的突破。一方面LLM相比传统NLP 在处理文本信息中的效率有所提升,另一方面特定数据训练赋予LLM 较好的解决垂类问题的能力,基于此当前LLM 对于固定范式下解决问题已经能够实现较好的自动化。我们认为通过Agent Workflow 的方式,能够更好的实现AI Agent 与具体任务的结合,或将推动LLM 技术在更复杂的应用场景中进一步提升效率。
Agent 改变人机交互方式,关注软硬件产业机遇AI+终端实现了安全性与个性化的结合,为Agent 落地打下良好基础。AIAgent 有望改变人机交互的方式,落地方式包括AIPC、AI 手机等。终端掌握了重要的交互入口,据Apple WWDC,Siri 用户每天发出的语音请求数量高达15 亿次,大量的交互为Agent 提供了丰富的场景载体;此外通过压缩模型到适合端侧大小的模型,使用优化算法加速推理,实现在端侧落地。对比Agent 的技术架构,往往也需要基础模型和小模型的共同支撑,我们认为端侧模型技术的发展(模型压缩等技术)有助于Agent 落地于终端。
相关公司梳理
从AI Agent 的进展看,在理论研究中发现通过CoT(思维链)、ReAct(推理+行动)等方式能够完成部分的任务规划,且长期看通过AI Agent 或有望进一步走向整体智能;在实践中,通过将AI 助手嵌入工作流也已打造出基于特定数据、场景的Agent 产品雏形,我们认为随着:1)底层大模型能力的提升;2)Agent+工作流的工程化实践深入,AI Agent 能力有望进一步提升,或将推动AI 商业化进程加速。重点关注公司:1)协同办公厂商:包括金山办公、泛微网络、福昕软件等;2)垂直应用厂商:包括用友网络、鼎捷软件、同花顺、中控技术、宝信软件等;3)终端厂商:中科创达等。
风险提示:模型能力进步不及预期;安全性风险;本研报中涉及到未上市公司和未覆盖个股内容,均系对齐客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。