Anthropic发布Claude Mythos 5人工智能模型——同时推出更安全的Fable 5供公众使用。

CN
Decrypt
關注
2 小時前

安索普(Anthropic)周二宣布正式推出Claude Mythos 5,这是一种限制访问的人工智能模型,该公司称其具有前所未有的网络安全能力,同时推出的还有Claude Fable 5,这是一个面向更广泛公众使用的版本。


在一篇博客文章中,安索普表示,Mythos 5最初仅对获得批准的网络安全组织、关键基础设施运营商、政府合作伙伴和部分生命科学研究人员开放。该公司表示,Mythos级人工智能模型“已经达到了一个阈值,存在重大风险。”


“在四月,我们启动了Project Glasswing,仅向一小部分网络防御者和关键软件基础设施提供者发布了首个Mythos级模型(Claude Mythos预览版),”安索普写道。“我们声明希望最终将Mythos级能力发布给所有用户,只要我们开发出足够强大的新安全措施,以可靠地防止滥用。”


此次发布是在对Mythos能够识别软件漏洞和进行复杂网络安全操作的能力表示担忧几个月之后进行的,此前有消息称该人工智能在三月在线泄露。今年早些时候,英国AI安全研究所报告称,预览版成为首个无需人类协助就完成32步企业网络入侵演习的人工智能模型。在四月,Mozilla报告称Mythos的预览版在Firefox浏览器中发现了超过271个漏洞。



直到现在,安索普一直通过该公司的Project Glasswing计划限制对Mythos的访问,以便研究人员评估风险。在X平台上的后续帖子中,安索普表示将继续通过“更广泛的可信访问计划”来扩展Mythos的访问,以进行网络安全工作和生物医学研究。


Mythos的发布也恰逢安索普与特朗普总统政府之间的紧张关系似乎有所缓解,此前曾就使用Claude进行军事操作发生了公开争执


“在与美国政府协商后,我们计划逐步扩大对Claude Mythos 5的访问,继续定期增加新合作伙伴,并推动一个可信访问计划,使网络安全组织能够以更系统的方式申请,”安索普写道,并补充说Mythos预览版的用户可以升级到Mythos 5。


本月早些时候,媒体报道称,安索普已在国家安全局内部嵌入工程师,以帮助部署其Mythos人工智能模型进行网络安全操作,目标 reportedly 为中国和伊朗。





除了Mythos 5外,安索普还发布了Claude Fable 5,这是一个Mythos级人工智能模型,使用与Mythos 5相同的核心设计,但为公众增加了额外的安全措施。


“Fable 5的能力超过了我们以往任何提供给公众的模型,”安索普写道。“在几乎所有测试的人工智能能力基准上,它都处于最先进的水平,在软件工程、知识工作、视觉、科学研究和许多其他领域表现出色。”


安索普表示,Mythos 5和Fable 5在多个软件工程、网络安全、生物学和推理基准上均获得了最高分。该公司报告称,在评估漏洞发现和利用的ExploitBench测评中得分为78%,在Terminal-Bench编码基准中得分为88%。安索普表示,结果表明这些模型能够处理比以往Claude系统更长更复杂的任务。


尽管安索普表示Fable 5在长时间复杂任务上表现尤其良好,但为了防止滥用,涉及网络安全、生物学、化学或人工智能模型复制的请求由Claude Opus 4.8处理——该公司的安全措施表示在不到5%的会话中被触发。


“发布这样一款强大的模型存在风险,”安索普写道。“没有安全措施,Fable 5在网络安全等领域的能力可能会被滥用,造成严重损害。”


此次发布恰逢人工智能开发者面临越来越多关于如何发布日益强大的系统的问题。安索普认为,Mythos可以帮助防御者在攻击者利用漏洞之前找到并修复它们。与此同时,批评者,包括OpenAI首席执行官山姆·奥特曼(Sam Altman),指责该公司使用“基于恐惧的营销”来推广其人工智能模型。


免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接