谷歌DeepMind 于周二推出了Gemini Robotics-ER 1.6,这是一个升级的AI模型,旨在通过增强的具身推理能力使机器人能够执行复杂的现实世界任务。该模型专注于空间理解、任务规划和成功检测,标志着AI驱动的机器人技术的重要进步,这可能会加速企业对自主系统的采用。
新模型在空间和物理推理任务中比其前身和Gemini 3.0 Flash表现出可测量的改善。Gemini Robotics-ER 1.6能够读取复杂的仪表和视镜——这一能力是谷歌DeepMind通过与波士顿动力的合作开发的,以满足特定的工业需求。
在安全隐患识别测试中,该模型在基于文本的场景中比Gemini 3.0 Flash提高了6%,在基于视频的场景中提高了10%。增强的能力现在可以通过Gemini API和谷歌AI Studio提供给开发者。
该模型的实际部署已经开始。波士顿动力将Gemini和Gemini Robotics ER 1.6集成到其Orbit AIVI-Learning平台中,过渡于4月8日正式上线,为注册客户提供服务。
波士顿动力Spot的副总裁兼总经理Marco da Silva表示:“仪表读取和更可靠的任务推理等能力将使Spot能够完全自主地看到、理解和应对现实世界的挑战。”
此次合作标志着从实验性AI研究向实际工业应用的转变。增强的空间推理和仪表读取能力可能使机器人能够执行以前需要人类监督的维护、检查和监测任务。
谷歌指出,此次合作利用了波士顿动力在商业机器人领域的既有影响力,其中Spot机器人已经能够在建设工地和工业设施中导航。将先进的AI集成到经过验证的硬件平台中,代表了一种可能加速各行业自主系统部署的融合。
Decrypt报道了谷歌不断发展的AI机器人能力,包括该公司早期开发的能够思考和搜索网络的机器人,以及波士顿动力的商业Atlas人形机器人的公告。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。