2025年是机器人研究的疯狂一年 长期存在的模型架构/训练挑战得到了解决,数据收集技术也取得了重大进展

CN
9小时前

2025年是机器人研究的疯狂一年

长期以来的模型架构/训练挑战得到了解决,数据收集技术、数据质量理解和数据配方方面取得了重大进展。这使得物理人工智能公司有信心最终开始投资于大规模数据收集。

我们看到像Figure、Dyna和PI这样的公司在多样化环境中的实际部署中达到了超过99%的成功率,利用了强化学习的创新。许多框架被开发出来,以实现自我改进和自我恢复的机器人模型。研究人员找到了在保持通用能力的同时防止VLA微调过拟合的方法。这意味着我们可以通过合并专业模型来构建通用模型。

机器人还可以通过动作分块和快速标记化等方法更加灵活地移动。我们看到机器人能够以人类的速度展现平滑的全身控制,而不是缓慢或颠簸的运动。

机器人专家展示了如何有效融合多模态传感器数据以实现巨大的策略改进。整合视觉、语言和触觉数据是具有挑战性的,但这样做为许多需要细致力感的接触丰富任务打开了大门。力感知还解决了常见问题,如视觉遮挡。

系统1/2架构经过强化,以处理长期规划/任务编排,使机器人能够执行需要一系列任务的工作。Gemini Robotics-ER 1.5将链式思维推理引入物理代理,使它们能够解析约束并评估语义安全性。

记忆的进步使机器人能够保持长期的时空推理,打破了“记忆墙”,采用了类脑算法。NVIDIA的ReMEmber使用基于记忆的导航,而Titans + MIRAS则实现了测试时记忆,以维持性能。

基础模型领域的进展也继续推动机器人技术的发展。更好的视觉语言模型意味着具有更好空间理解和数据标注及处理管道的视觉语言代理,这可以大幅提高吞吐量。世界模型开始在数据增强和策略评估中显示出潜力。

2025年让我们初步体验了数据规模的潜力。我们看到了未来的曙光,机器人展现出新兴智能,如零-shot可供性映射、视觉力敏感性以及各种通用物理推理。

2026年,我们将体验到数据规模达到100倍的物理人工智能。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接