MiniMax @MiniMax_AI 发布的 M2

MiniMax @MiniMax_AI 发布的 M2.7 号称编程接近Opus水平 MM-Claw 的评测中接近 Sonnet 4.6。

想问下大家开始用了吗？

真实效果如何？

如果能力大幅提升，成本是不能又能降低点了！

他们在公众文写到：

团队基于 M2 早期版本构建研究型 Agent 框架，让模型自主完成强化学习 Skill 构建、记忆更新和过程优化。

在一项内部实验中，M2.7 自主运行超 100 轮迭代循环（分析失败轨迹、修改脚手架、运行评测、对比结果），最终在内部评测上效果提升 30%。

在 MLE Bench Lite 的 22 个机器学习任务中，三次测试平均得牌率 66.6%，与 Gemini-3.1 持平，仅次于 Opus 4.6（75.7%）和 GPT-5.4（71.2%）。

编程方面，M2.7 在 SWE-Pro 得分 56.22%，追平 GPT-5.3-Codex；VIBE-Pro 55.6%，接近 Opus 4.6；Terminal Bench 2 得分 57.0%。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

BITWU.ETH的精選文章