谷歌重塑物理 AI 智能体：赋予机器人"大脑和身体"，让其学会"先思考，后行动"

作者

2025-09-29

84次阅读

人工智能

谷歌 DeepMind 团队发布了两款专为物理世界设计的AI新模型：Gemini Robotics 1.5 与 Gemini Robotics-ER 1.5，旨在打造能够感知、规划、思考并行动的物理智能体。新系统采用创新的"大脑-身体"协作框架：* 大脑 (Gemini Robotics-ER 1.5)：作为高层规划与决策模型，具备强大的空间理解能力。例如，在处理垃圾分类任务时，它能主动上网搜索本地规定并制定详细计划。* 身体 (Gemini Robotics 1.5)：作为一个视觉-语言-行动（VLA）模型，它接收“大脑”分解的自然语言指令，并将其直接转化为机器人的具体动作。Gemini Robotics 1.5 的核心突破在于其“先思考后行动”的能力。在执行任务前，它会以自然语言生成内部推理序列，从而更深刻地理解任务语义，这不仅提升了成功率，也使其决策过程更加透明。此外，新模型展现了卓越的跨机器人形态学习能力，可以将一个机器人（如 ALOHA 2）上学到的技能成功迁移至形态完全不同的机器人（如 Apollo 人形机器人），无需额外训练，极大地加速了新技能的部署。谷歌强调，在发展 embodied AI（具身人工智能）的同时，已实施整体安全策略。目前，Gemini Robotics-ER 1.5 已通过 Gemini API 向开发者开放，Gemini Robotics 1.5 则提供给部分合作伙伴使用。