腾讯混元开源首个面向世界模型的强化学习后训练框架WorldCompass

律动BlockBeats
律动BlockBeats|2026年03月10日 07:28
腾讯混元 3D 团队开源首个面向世界模型的强化学习后训练框架 WorldCompass。WorldCompass 是专为长时序、交互式世界模型设计的强化学习(RL)后训练框架。如果说世界模型是引擎,那么 WorldCompass 就是精准的「指南针」,通过引入强化学习机制,直接「引导」模型如何更准确地遵循用户指令探索世界,并保持长时序的视觉一致性。(据 1M AI News)
曾提及
分享至:

脉络

热门快讯

APP下载

X

Telegram

Facebook

Reddit

复制链接

热门阅读