马具可能是人工智能的新护城河

马具可能是人工智能的新护城河。

在SWE-bench Pro上，通过不同支架运行相同模型的解决率波动达22个百分点。在同一支架内部更换六个最佳前沿模型，其变化不到一个百分点。

Meta和哈佛将Sonnet 4.5与一个定制马具配对，得分为52.7%，超过了Anthropic自己使用更昂贵的Opus模型的支架的52.0%。更便宜的模型获胜是因为它的马具更好。

@NousResearch围绕同一理论构建了Hermes Agent。每次会话将其状态写入你的机器。对话历史进入本地SQLite数据库并具备全文搜索功能，项目背景和个人偏好以markdown文件的形式在代理启动时加载。复杂任务被保存为可重用的技能文件，而Honcho保持你工作的结构化个人资料。

底层模型是可互换的。封闭代理保持你的上下文，离开意味着需要从头开始重建。Hermes让你可以将你的上下文带到任何你想要的模型中。

封闭实验室在长会话中占有优势，因为它们针对数千小时的降级运行进行了微调，而开源提供者没有足够的会话数据来匹配。

Hermes在一周内通过OpenRouter处理了3.2万亿个令牌，这为Nous提供了缩小差距的路径。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

Delphi Digital的精选文章