MiniMax @MiniMax_AI 发布的 M2.7 号称编程接近Opus水平 MM-Claw 的评测中接近 Sonnet 4.6。
想问下大家开始用了吗?
真实效果如何?
如果能力大幅提升,成本是不能又能降低点了!
他们在公众文写到:
团队基于 M2 早期版本构建研究型 Agent 框架,让模型自主完成强化学习 Skill 构建、记忆更新和过程优化。
在一项内部实验中,M2.7 自主运行超 100 轮迭代循环(分析失败轨迹、修改脚手架、运行评测、对比结果),最终在内部评测上效果提升 30%。
在 MLE Bench Lite 的 22 个机器学习任务中,三次测试平均得牌率 66.6%,与 Gemini-3.1 持平,仅次于 Opus 4.6(75.7%)和 GPT-5.4(71.2%)。
编程方面,M2.7 在 SWE-Pro 得分 56.22%,追平 GPT-5.3-Codex;VIBE-Pro 55.6%,接近 Opus 4.6;Terminal Bench 2 得分 57.0%。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。