毫末发布自动驾驶首个生成式大模型:DriveGPT4 月11 日,毫末举行第8 届AI DAY,发布了纯视觉为主的DriveGPT 大模型,该模型现阶段主要用于解决自动驾驶认知决策问题,可以通过输入驾驶场景数据进行多场景预测并规划最佳行径路途。目前DriveGPT 已经包含4000 万公里的量产车驾驶数据、1200 亿参数,拥有19.6 亿个30 万类场景标签。DriveGPT 将在今年新摩卡DHT-PHEV 车型首发落地,提升HPilot高速/城市NOH 安全性和流畅性。我们认为GPT 大模型范式有望赋能垂直领域智能驾驶感知标注、决策推理等核心环节,加速智驾落地,同时大模型研发或推动驾驶数据和算力需求快速增长。推荐经纬恒润、舜宇、联创。
DriveGPT:大模型赋能场景生成、轨迹预测、推理决策毫末智行发布了其DriveGPT 自动驾驶生成式大模型,具体逻辑:(1)感知环境离散化后作为token 设计drive language;(2)输入大量驾驶场景数据,利用transformer 模型生成系列决策结果;(3)RLHF:将人工挑选困难场景Clips(数据组)输入训练模型,对生成结果进行最优解排序;(4)RewardModel 强化学习。DriveGPT 目前可以根据历史一段时间驾驶场景序列数据,不断生成未来可能发生的多种驾驶环境并预测每种情况下车辆行驶轨迹。此外公司目前正设计利用prompt 提示优化输出结果,并给DriveGPT 加入思考链,使驾驶策略具备逻辑可解释性,解决transformer 黑盒模式潜在问题。
机会:大模型有望解决行业数据标注准确率及成本困境视觉识别是开发大模型的基础能力之一,识别传感器输入图像中的车道线、车辆、行人、交通灯等要素并进行数据标注才能获得大量的可用训练数据集。
我们看到DriveGPT 等大模型可以很好地自动识别图像以替代人工标注,据毫末会上表示,DriveGPT 可以将交通场景图像的标注费用从行业平均约5元/张降至约0.5 元/张,计划逐步向合作伙伴开放该服务。同时,我们认为近期Meta 的CV 模型SAM 有望赋能自动驾驶行业,SAM 无需额外训练即可自动完成分割,提升机器视觉,有利于自动驾驶可用训练集快速积累。
挑战:国内AI 智能驾驶大模型应用普及仍面临数据需求和算力等挑战(1)数据:DriveGPT 目前参数量约1200 亿,拥有约4,000 万公里的量产车驾驶数据。参考行业龙头特斯拉2020 年已有超48 亿公里数据,大模型赋能下我们认为国内公司或将加快智能驾驶系统量产上车步伐,加快数据搜集回馈模型训练。(2)算力:特斯拉FSD 背后拥有1.4W 个GPU 训练集群;毫末建设MANA OASIS 中心给DriveGPT 提供67 亿次/秒的高性能浮点运算,2T/秒存储带宽,以及800G/秒通信带宽支持;小鹏计算中心“扶摇”提供算力达600PFLOPS。大模型、大数据驱动的智能驾驶对算力提出了更高要求,有望驱动算力基础设施需求。建议关注L2 级自动驾驶/算力产业链。
风险提示:L3 智能驾驶落地进度较缓,数据/算力积累程度不及预期。