长猫-2.0:一直悄然主导开放路由的隐形人工智能模型

CN
Decrypt
关注
3小时前

中国科技公司美团于6月30日正式发布了LongCat-2.0,确认这一开放许可证、1.6万亿参数的专家混合人工智能模型就是在OpenRouter上以化名Owl Alpha匿名运行两个月的同一系统。


参数是模型在训练过程中可以处理的总拨动数量。该模型每个令牌(人工智能模型处理的最小数据单元)大约激活480亿个参数,根据查询的复杂程度,该数字在330亿到560亿之间波动。


隐秘期的付出得到了回报。当美团站出来的时候,该模型已经在Hermes Agent工作区中排名第一,在Claude Code中排名第二,在OpenClaw部署中排名第三,所有排名均按每月调用量排序。


这是第一个在国内中国ASIC上进行端到端训练和部署的万亿参数模型,而不仅仅是在其他地方训练后在其上提供服务。相比之下,DeepSeek的V4-Pro仅在推理时使用了华为芯片,而预训练是在Nvidia硬件上进行的。





美团表示,预训练运行跨越了超过35万亿个令牌,使用超过50,000个国产加速器完成,且“没有回滚或不可恢复的损失高峰。”这个稳定性声明很重要,因为大型训练在未经验证的硬件堆栈上中途失败的情况非常频繁,而中国似乎正在减少对美国硬件的依赖,以训练其模型。


价格是LongCat-2.0真正的优势所在。标准API访问每百万输入令牌为0.75美元,每百万输出为2.95美元,在当前推出促销期间降至0.30美元/1.20美元,缓存上下文读取免费。这低于GPT-5.5每百万令牌的5美元/30美元,Claude Sonnet 5的入门价2美元/10美元,接近DeepSeek V4-Pro的0.435美元/0.87美元以及小米的MiMo-V2.5 Pro,后者在自己的5月降价后也达到了相同的价格。


美团还提供了令牌套餐,这使得对程序员和重度用户来说更加便宜,提供约6000美元的10亿令牌包。



我们自己也对LongCat-2.0进行了快速游戏构建测试。它完成了任务,并且输出在经过几轮迭代后表现得相当不错。结果可见地落后于Claude Fable和Opus 4.8,更接近Sonnet 4.6,但在这些价格下,性价比的计算很难反驳。


它让敌人以不同的角度袭来,摄像机自动聚焦在最近的敌人上。然而,模型的逻辑并没有考虑到当敌人数量随着难度增加时会发生什么。在更高的速度下,目标切换逻辑变得不稳定;在输入提示时,焦点会跳到更近的敌人,使游戏令人沮丧地无法玩耍。


这在氛围编码会议中是正常的,其中模型并不预见决策的许多逻辑后果,而是专注于根据用户提示提供结果,字面意思。


这也是低价模型始终是一个好选择的原因,因为它给用户提供了更多机会逐步改善每个结果,直到最终产品符合期望。




如果说有什么,那就是在没有进一步互动的情况下,乍一看,整体质量在我们的快速编码测试中落在DeepSeel v4 Flash和Deepseek v4 Pro之间。


您可以在我们的itch.io网站上查看结果


美团是如何构建它的


LongCat-2.0使用了几种技术,使模型更快、更强大而不显著增加其大小。


其基于DeepSeek设计的注意力系统,仅关注非常长对话中最相关的部分,而不是均等处理所有内容,帮助它更快速地响应。


此外,新的N-gram嵌入系统(帮助理解词组或子词组的方式)使模型对词语和短语有了更丰富的理解——可能的表示增加了大约100倍——而不需要增加更多的AI组件。它基本上是在教AI识别常见短语,而不仅仅是单个词汇。它不仅将“New”、“York”和“City”视为三个独立的部分,还可以将“New York City”视为一个有意义的整体。这使得模型在理解语言方面更加丰富,而不需要使其显著增大。


训练后,美团还结合了三个专门的系统,一个专注于使用工具(Agent),一个专注于解决问题(Reasoning),一个专注于对话(Interaction)。然后,一个路由机制决定哪种专家组合应该处理每个请求,就像将合适的团队分配给合适的工作一样。




SWE-bench Pro上,这是一个衡量模型解决实时GitHub问题的基准,LongCat-2.0得分为59.5,超过了GPT-5.5的58.6和Gemini 3.1 Pro的54.2,尽管仍落后于Claude Opus 4.7和4.8。在FORTE上,该系统在45分钟的时间限制下对15个职业的日常办公室任务进行评分,得分为73.2,与Claude Opus 4.6持平,但落后于GPT-5.5的77.8。



预算有限的团队或任何进行高容量仓库级工作的人员可以获得最明确的胜利,因为免费上下文缓存读取的复合效果。该模型今天可以通过美团的OpenAI和Anthropic兼容API端点,或通过已经集成它的代理工具如Hermes、Claude Code和OpenClaw来访问。


目前需要自托管的用户没那么幸运。GitHub和Hugging Face的库仍然显示“模型权重即将发布”,但美团尚未设定文件发布的日期。


免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接