投资建议:Figure 01搭配OpenAI展现出了极强的泛化能力,具身智能在大模型加持续有望持续突破,建议持续关注机器人产业链核心公司。1)执行器和电机:受益标的为三花智控、拓普集团、鸣志电器;2)减速器:受益标的为中大力德;3)电机驱动控制芯片:受益标的为峰岹科技;4)传感器:推荐标的为东华测试,受益标的为柯力传感、奥比中光;5)丝杠类:推荐标的为五洲新春、恒立液压和长盛轴承,受益标的为北特科技、丰立智能、贝斯特和新坐标;6)丝杠设备类:受益标的为华辰装备、日发精机、秦川机床、浙海德曼和思进智能。
明星机器人创业公司Figure 官方发布了自己第一个OpenAI 大模型加持的机器人demo。视频中,接入大模型的机器人能够与人进行完整对话,并根据人类语音指示进行任务处理。
视频展示内容:
1)听从人类的命令,递给人类苹果;
2)将黑色塑料袋收拾进框子里;
3)将杯子和盘子归置放在沥水架上;
4)对各种问题进行相应回复,如,说明把苹果递过去的原因,要将盘子放在何处,对自己的行动做出评价等等。
Figure 01 + Ope nAI,具身智能加速演进。Figure 01 展示了端到端神经网络框架下与人类的对话,没有任何远程操作,并且速度开始接近人类。目前Figure 01 现在可以做到描述其视觉体验、规划未来的行动、反思自己的记忆、口头解释推理过程等工作。从具体实现过程看,技术人员将机器人摄像头中的图像输入,并将麦克风捕获的语音文本转录到由 OpenAI 训练的大型多模态模型中,从而获得语言响应,然后通过文本到语音的方式将其回复给人类。从双手操作看,所有行为均由神经网络视觉运动transformer 策略驱动,将像素直接映射到动作。这些网络以10hz 的频率接收机载图像,并以200hz 的频率生成24-DOF 动作(手腕姿势和手指关节角度),全身控制器确保安全、稳定的动力,例如保持平衡。
风险提示:1)人形机器人技术研发进程不及预期;2)商业化应用场景不及预期;3)降本进程不及预期;4)产业政策落地不及预期。