OpenRouter的融合承诺以低价提供克劳德寓言级别的人工智能——正值寓言5黯然失色。

CN
Decrypt
关注
1小时前

OpenRouter推出了一款围绕简单赌注构建的API:一个廉价AI模型的小组,经过正确组合,可以匹配一个单独昂贵的模型。而这里的“昂贵”指的是Claude Fable 5。


该产品被称为Fusion。它将一个提示并行发送给多个模型,然后使用一个判断模型和一个合成器将结果合并成一个有据可依的答案。


时机恰到好处。在上周发布Fable 5和Mythos 5后不久,美国出口管制指令迫使Anthropic暂停所有针对全球外国国籍的模型,理由是争议的越狱发现。OpenRouter次日将此消息分享到X平台,直言以“Fable级别的智能,价格仅为一半”的承诺填补了这一空白。



如何获得便宜的Fable


当您将提示发送到Fusion时,OpenRouter会将其并行发送到多个模型。每个模型都可以使用网页搜索和bash工具。


然后,一个判断模型从每个响应中提取共识点、矛盾和盲点。在此阶段结束后,一个合成器——默认使用Claude Opus 4.8——根据该分析撰写最终答案。


整个过程在服务器端进行。您可以将模型字符串替换为“openrouter/fusion”以获取默认小组,添加一个合成工具以便您的模型可以选择性地调用它,或者在Fusion聊天室中无需编码构建自定义小组。


OpenRouter在DRACO上进行了测试,该基准由真实用户的深入研究请求构建。Fable 5与OpenAI的GPT-5.5配对,并由Opus合成,得分为69%。单独的Fable得分为65.3%,尽管其100个任务中有七个因自己的内容过滤器被阻止而未能执行。




OpenRouter希望被记住的更便宜组合是:廉价的Gemini 3 Flash与开源的中文模型Kimi K2.6和DeepSeek V4 Pro结合,由Opus融合和合成,达到了64.7%——直接超过了单独的GPT-5.5(60%)和单独的Opus 4.8(58.8%),并且成本只有Fable的一半。


即使是将Opus 4.8与单独的实例配对,得分也达到了65.5%,比单独的Opus提高了6.7个百分点;OpenRouter表示,这一提升中大约四分之三来自合成步骤,其余来自真正的模型多样性。


一个小问题是:给予小组实时网络访问权限,会使模型在搜索结果中呈现DRACO自己的评分标准,这是一种OpenRouter称之为偶然而非故意的污染风险。解决方案只需在配置中排除基准托管域名,所有发布的数据均反映了这一清理后的结果。





值得一试吗?


OpenRouter明确表示,Fusion并不是完整的Fable替代品。DRACO跳过了长期工作,而Fable据报道仍处于领先地位,对于编码而言,Fusion作为一个编码模型选择性调用的工具,而不是全面的替换——这一警告呼应了Decrypt测试DeepClaude时发现的问题,这是一种便宜的后端替换,保持了Claude Code的代理循环完整,但在最困难的推理任务上仍落后于Opus。


常规模型仍负责日常事务。Fusion则用于可能遗漏重要信息的问题,多个视角交叉检查实际上会推动进程。


对于深度研究、复杂规划,或任何矛盾重要的场合,这种方法似乎确实有帮助。


图表清楚地传达了基本观点:在这类工作中,昂贵的单独模型不再是获得强大合成的唯一方式。一组仍然易于获取的模型,融合在一起,可以在结果中与其并排出现,同时带来更小的花费。




发布线程在情感追踪中大约呈现2比1的积极分裂。AI研究员Andrew Trask称其为“比看起来更重要的事情”,主张前沿实验室再也不会独占前沿。然而,怀疑者对此表示反击,指出糟糕的编码结果、错误的工具调用以及由于Fable 5不再可用而缺乏透明度,无法比较结果。


Fusion完全运行在通过OpenRouter自身基础设施路由的模型上,因此不能从源头解决出口控制问题。现在被排除在Fable 5之外的用户有其他选择:Fusion小组、像DeepClaude这样的后端替换,或像GLM-5.2这样的开源替代方案,虽然可能没有更好,但在价格上足够实用。


免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接