马具可能是人工智能的新护城河

CN
2小时前

马具可能是人工智能的新护城河。

在SWE-bench Pro上,通过不同支架运行相同模型的解决率波动达22个百分点。在同一支架内部更换六个最佳前沿模型,其变化不到一个百分点。

Meta和哈佛将Sonnet 4.5与一个定制马具配对,得分为52.7%,超过了Anthropic自己使用更昂贵的Opus模型的支架的52.0%。更便宜的模型获胜是因为它的马具更好。

@NousResearch围绕同一理论构建了Hermes Agent。每次会话将其状态写入你的机器。对话历史进入本地SQLite数据库并具备全文搜索功能,项目背景和个人偏好以markdown文件的形式在代理启动时加载。复杂任务被保存为可重用的技能文件,而Honcho保持你工作的结构化个人资料。

底层模型是可互换的。封闭代理保持你的上下文,离开意味着需要从头开始重建。Hermes让你可以将你的上下文带到任何你想要的模型中。

封闭实验室在长会话中占有优势,因为它们针对数千小时的降级运行进行了微调,而开源提供者没有足够的会话数据来匹配。

Hermes在一周内通过OpenRouter处理了3.2万亿个令牌,这为Nous提供了缩小差距的路径。


免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接