微软表示最新的人工智能模型击败了Claude和谷歌的Nano Banana。

在周二举行的年度微软Build活动的第一天，Windows开发团队发布了七个新的AI模型，声称它们在盲测和图像编辑基准测试中超过了Anthropic的Claude Sonnet 4.6和Google的Nano Banana 2。

这一声明是在微软试图确立自己作为前沿AI开发者，而不仅仅是OpenAI最大的支持者和基础设施提供者的背景下提出的。

“非常激动地宣布今天推出七个新的世界级MAI模型，”微软AI首席执行官穆斯塔法·苏莱曼在X上写道。“它们代表了我们所认为的一个新的AI时代，旨在让您保持控制，站在前沿。”

此次发布的核心是MAI-Thinking-1，一个推理模型，微软将其描述为公司旗舰文本基础模型。

据苏莱曼说，在独立评估者进行的盲测中，MAI-Thinking-1优于Anthropic的Claude Sonnet 4.6。他补充说，该模型在AIME 2025基准测试中得分为97%，该基准测试衡量高级问题解决和推理能力。

苏莱曼表示，SWE Bench Pro的结果将该模型“与Opus 4.6放在同一个最严峻的编码基准之中。”

该公司还介绍了MAI-Code-1-Flash，一个为GitHub Copilot和Visual Studio Code构建的轻量级编码模型；MAI-Image-2.5及其Flash变体，微软表示它们在图像编辑任务中超过了Google的Nano Banana Pro；MAI Transcribe-1.5，一个支持43种语言的转录模型；以及MAI-Voice-2，一个能够用15种语言生成自然声音并根据短音频样本适应说话者的语音生成模型。

“这是技术历史上一个非凡的时刻。用于训练前沿模型的计算能力增加了1000亿倍，”苏莱曼在一篇博文中宣布了新模型。“现在我们预计在未来三年内，再次增加千倍，这意味着更先进的能力，以及不断推出更加有效的AI。”

这一公告是在领先的AI开发者之间竞争日益激烈的背景下发布的。

上周，Anthropic宣布推出其最新的旗舰模型，Opus 4.8，该公司表示该模型在基准测试中更快更智能，并配备一系列新功能。周二，Anthropic宣布扩展其项目Glasswing，使150家公司能够访问其新的专注于网络安全的Mythos模型。

与此同时，在5月的Google I/O大会上，Google推出了Gemini Omni，这是一个将Gemini与公司的Veo、Nano Banana和Genie媒体生成模型结合的多模态AI模型，并且推出了Gemini Spark，一个设计用于代表用户管理跨应用和工作流程任务的云基础AI代理。

微软的新模型发布表明其更广泛的努力，旨在构建专有AI系统，以扩展其长期以来对OpenAI技术的依赖，称MAI“在质量方面提供了最高的胜率，在成本上比GPT-5.5低10倍。”

“开发者和企业一直在呼吁AI可以按照他们的条件和声音来提供，”苏莱曼写道。“我们认为这是朝着实现这一目标迈出的重要一步。”

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

微软表示最新的人工智能模型击败了Claude和谷歌的Nano Banana。

Decrypt的精选文章

目录

相关文章