微软表示最新的人工智能模型击败了Claude和谷歌的Nano Banana。

CN
Decrypt
关注
17分钟前

在周二举行的年度微软Build活动的第一天,Windows开发团队发布了七个新的AI模型,声称它们在盲测和图像编辑基准测试中超过了Anthropic的Claude Sonnet 4.6和Google的Nano Banana 2。


这一声明是在微软试图确立自己作为前沿AI开发者,而不仅仅是OpenAI最大的支持者和基础设施提供者的背景下提出的。


“非常激动地宣布今天推出七个新的世界级MAI模型,”微软AI首席执行官穆斯塔法·苏莱曼 在X上写道。“它们代表了我们所认为的一个新的AI时代,旨在让您保持控制,站在前沿。”


此次发布的核心是MAI-Thinking-1,一个推理模型,微软将其描述为公司旗舰文本基础模型。



据苏莱曼说,在独立评估者进行的盲测中,MAI-Thinking-1优于Anthropic的Claude Sonnet 4.6。他补充说,该模型在AIME 2025基准测试中得分为97%,该基准测试衡量高级问题解决和推理能力。


苏莱曼表示,SWE Bench Pro的结果将该模型“与Opus 4.6放在同一个最严峻的编码基准之中。”


该公司还介绍了MAI-Code-1-Flash,一个为GitHub Copilot和Visual Studio Code构建的轻量级编码模型;MAI-Image-2.5及其Flash变体,微软表示它们在图像编辑任务中超过了Google的Nano Banana Pro;MAI Transcribe-1.5,一个支持43种语言的转录模型;以及MAI-Voice-2,一个能够用15种语言生成自然声音并根据短音频样本适应说话者的语音生成模型。





“这是技术历史上一个非凡的时刻。用于训练前沿模型的计算能力增加了1000亿倍,”苏莱曼在一篇博文中宣布了新模型。“现在我们预计在未来三年内,再次增加千倍,这意味着更先进的能力,以及不断推出更加有效的AI。”


这一公告是在领先的AI开发者之间竞争日益激烈的背景下发布的。


上周,Anthropic宣布推出其最新的旗舰模型,Opus 4.8,该公司表示该模型在基准测试中更快更智能,并配备一系列新功能。周二,Anthropic宣布扩展其项目Glasswing,使150家公司能够访问其新的专注于网络安全的Mythos模型。


与此同时,在5月的Google I/O大会上,Google推出了Gemini Omni,这是一个将Gemini与公司的Veo、Nano Banana和Genie媒体生成模型结合的多模态AI模型,并且推出了Gemini Spark,一个设计用于代表用户管理跨应用和工作流程任务的云基础AI代理。


微软的新模型发布表明其更广泛的努力,旨在构建专有AI系统,以扩展其长期以来对OpenAI技术的依赖,称MAI“在质量方面提供了最高的胜率,在成本上比GPT-5.5低10倍。”


“开发者和企业一直在呼吁AI可以按照他们的条件和声音来提供,”苏莱曼写道。“我们认为这是朝着实现这一目标迈出的重要一步。”


免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接