谷歌重塑物理 AI 智能体:赋予机器人"大脑和身体",让其学会"先思考,后行动"
作者
2025-09-29
4次阅读
人工智能

谷歌 DeepMind 团队发布了两款专为物理世界设计的AI新模型:Gemini Robotics 1.5 与 Gemini Robotics-ER 1.5,旨在打造能够感知、规划、思考并行动的物理智能体。新系统采用创新的"大脑-身体"协作框架:* 大脑 (Gemini Robotics-ER 1.5):作为高层规划与决策模型,具备强大的空间理解能力。例如,在处理垃圾分类任务时,它能主动上网搜索本地规定并制定详细计划。* 身体 (Gemini Robotics 1.5):作为一个视觉-语言-行动(VLA)模型,它接收“大脑”分解的自然语言指令,并将其直接转化为机器人的具体动作。Gemini Robotics 1.5 的核心突破在于其“先思考后行动”的能力。在执行任务前,它会以自然语言生成内部推理序列,从而更深刻地理解任务语义,这不仅提升了成功率,也使其决策过程更加透明。此外,新模型展现了卓越的跨机器人形态学习能力,可以将一个机器人(如 ALOHA 2)上学到的技能成功迁移至形态完全不同的机器人(如 Apollo 人形机器人),无需额外训练,极大地加速了新技能的部署。谷歌强调,在发展 embodied AI(具身人工智能)的同时,已实施整体安全策略。目前,Gemini Robotics-ER 1.5 已通过 Gemini API 向开发者开放,Gemini Robotics 1.5 则提供给部分合作伙伴使用。