作者: Anthropic
编译: 深潮 TechFlow
深潮导读: Anthropic 发布了一个尚未公开的前沿模型 Claude Mythos Preview,其代码审计能力已超过绝大多数人类安全专家,能自主发现存在数十年的零日漏洞。
基于这一能力,Anthropic 联合 AWS、苹果、谷歌、微软、英伟达等 12 家科技巨头发起 Project Glasswing 计划,投入 1 亿美元信用额度,目标是在攻击者获得同等能力之前,先把全球关键软件的漏洞堵上。
引言
今天我们宣布 Project Glasswing(玻璃翼计划),一项汇集亚马逊云科技(AWS)、Anthropic、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux 基金会、微软、英伟达和 Palo Alto Networks 的新倡议,目标是保护全球最关键的软件安全。
我们发起 Project Glasswing,是因为 Anthropic 训练的一个新前沿模型展现出了我们认为可能重塑网络安全格局的能力。Claude Mythos Preview 是一个通用的、尚未发布的前沿模型,它揭示了一个残酷事实:AI 模型的编码能力已经达到了这样的水平——在发现和利用软件漏洞方面,它们可以超越除最顶尖专家之外的所有人。
Mythos Preview 已经发现了数千个高危漏洞,涵盖每一个主流操作系统和每一个主流浏览器。按照 AI 的进步速度,这种能力在不远的将来就会扩散,可能落入不负责任的使用者手中。对经济、公共安全和国家安全的冲击可能非常严重。Project Glasswing 是一次紧迫的尝试,要把这些能力优先用于防御。
作为 Project Glasswing 的一部分,上述合作伙伴将在其防御性安全工作中使用 Mythos Preview;Anthropic 会分享所学经验,让整个行业受益。我们还向另外 40 多个构建或维护关键软件基础设施的组织开放了访问权限,让它们可以扫描和加固自有系统及开源系统。Anthropic 为此承诺投入最高 1 亿美元的 Mythos Preview 使用额度,以及 400 万美元直接捐赠给开源安全组织。
Project Glasswing 只是一个起点。没有哪家机构能独自解决网络安全问题:前沿 AI 开发者、其他软件公司、安全研究人员、开源维护者以及全球各国政府都有不可替代的角色。防御全球网络基础设施可能需要数年时间;而前沿 AI 能力在未来几个月内就可能大幅跃进。网络防御者要想占据先机,必须现在就行动。
AI 时代的网络安全
我们每天依赖的软件——运行银行系统、存储医疗记录、连接物流网络、维持电网运转——一直都有 bug。大多数无关紧要,但有些是严重的安全缺陷,一旦被发现,攻击者就能劫持系统、瘫痪运营或窃取数据。
网络攻击对企业网络、医疗系统、能源基础设施、交通枢纽以及各国政府机构的破坏性后果已经有目共睹。在全球层面,来自中国、伊朗、朝鲜和俄罗斯的国家级攻击已经威胁到了支撑民用生活和军事准备的基础设施。即使是针对单个医院或学校的小规模攻击,也能造成巨大经济损失、暴露敏感数据,甚至危及生命。全球网络犯罪的年度经济损失难以精确估算,但可能在 5000 亿美元左右。
过去,很多软件缺陷多年不被发现,因为找到并利用它们需要极少数安全专家才具备的专业知识。但随着最新前沿 AI 模型的出现,发现和利用软件漏洞所需的成本、精力和专业门槛都大幅降低了。过去一年,AI 模型在代码阅读和推理方面越来越强,尤其在发现漏洞和构造利用方式方面表现惊人。Claude Mythos Preview 在这些网络安全技能上实现了跨越式提升——它发现的一些漏洞在人类审查了几十年、经历了数百万次自动化安全测试后依然存活,而它开发的利用代码也越来越精巧。
在首届 DARPA 网络大挑战赛十年后,前沿 AI 模型正在接近甚至追平最顶尖人类的漏洞发现和利用能力。如果没有必要的安全措施,这些强大的网络能力可能被用来利用全球最重要软件中现存的大量缺陷。网络攻击会变得更频繁、更具破坏力,也会让美国及其盟友的对手获得力量。这是民主国家必须重视的安全优先级。
好消息是:让 AI 模型在错误的手中变得危险的那些能力,同样使它们在发现和修复重要软件缺陷方面极具价值——也能帮助生产出安全 bug 更少的新软件。Project Glasswing 是让防御者在即将到来的 AI 驱动网络安全时代建立持久优势的重要一步。
Claude Mythos Preview 发现漏洞和利用方式的能力
过去几周,我们使用 Claude Mythos Preview 在每一个主流操作系统、每一个主流浏览器以及一系列其他重要软件中,发现了数千个零日漏洞(即此前软件开发者完全不知道的缺陷),其中许多是高危级别。
在 Frontier Red Team 博客上,我们披露了其中一部分已被修复的漏洞的技术细节,以及 Mythos Preview 找到的利用方式。几乎所有这些漏洞的发现(以及许多相关利用方式的开发),都是模型完全自主完成的,没有任何人类引导。以下是三个例子:
- Mythos Preview 在 OpenBSD 中发现了一个存在 27 年的漏洞。OpenBSD 以极高的安全加固水准闻名,被广泛用于防火墙和其他关键基础设施。该漏洞允许攻击者仅通过连接目标机器就能远程使其崩溃。
- 它还在 FFmpeg 中发现了一个 16 年的漏洞。FFmpeg 被无数软件用于视频编解码。问题出在一行代码上,而自动化测试工具已经命中这行代码 500 万次,却从未发现问题。
- 该模型自主发现并串联了 Linux 内核中的数个漏洞(Linux 内核运行着全球大部分服务器),实现了从普通用户权限到完全控制机器的提权攻击。
上述漏洞我们已全部报告给相关软件维护者,且均已修复。对于其他许多漏洞,我们今天提供了细节的加密哈希(见 Red Team 博客),待修复完成后再公开具体信息。
CyberGym 等评估基准也验证了 Mythos Preview 与我们次强模型 Claude Opus 4.6 之间的显著差距:
网络安全漏洞复现 - CyberGym

除了我们自己的工作,许多合作伙伴也已使用 Claude Mythos Preview 数周。以下是他们的反馈:
「AI 能力已经跨过了一个门槛,从根本上改变了保护关键基础设施免受网络威胁所需的紧迫程度,而且不可逆转。我们用这些模型的基础工作表明,可以以前所未有的速度和规模识别和修复硬件与软件中的安全漏洞。这是一个深刻的转变,也是一个清晰的信号:旧的系统加固方式已经不够了。技术提供商必须立即积极采用新方法,客户也需要做好部署准备。这就是思科加入 Project Glasswing 的原因——这项工作太重要、太紧迫,不能单打独斗。」
—— Anthony Grieco,思科高级副总裁兼首席安全与信任官
「在 AWS,我们在威胁出现之前就构建防御,从定制芯片到整个技术栈。安全不是某个阶段的事,它是持续的,嵌入我们所做的一切。我们的团队每天分析超过 400 万亿次网络流量以检测威胁,AI 是我们大规模防御能力的核心。我们一直在自己的安全运营中测试 Claude Mythos Preview,将其应用于关键代码库,它已经在帮助我们加固代码。我们正在为与 Anthropic 的合作注入深厚的安全专业知识,并帮助强化 Claude Mythos Preview,让更多组织能以最高安全标准推进工作。」
—— Amy Herzog,亚马逊云科技副总裁兼首席信息安全官
「当网络安全不再受限于纯人力能力时,负责任地使用 AI 来大规模提升安全性和降低风险的机会是史无前例的。加入 Project Glasswing 并获得 Claude Mythos Preview 的访问权限,使我们能够尽早识别和缓解风险,增强我们的安全和开发解决方案,从而更好地保护客户和微软。在我们的开源安全基准 CTI-REALM 上测试时,Claude Mythos Preview 相比之前的模型表现出了实质性提升。我们期待与 Anthropic 及更广泛的行业合作,为所有人改善安全成果。」
—— Igor Tsyganskiy,微软网络安全与微软研究执行副总裁
「漏洞从被发现到被攻击者利用的窗口期已经坍塌——过去需要几个月的事,现在用 AI 几分钟就能完成。Claude Mythos Preview 展示了防御者大规模行动的可能性,而对手将不可避免地寻求利用同样的能力。这不是放慢脚步的理由,而是一起加速前进的理由。要部署 AI,就必须有安全保障。这就是 CrowdStrike 从第一天就参与其中的原因。」
—— Elia Zaitsev,CrowdStrike 首席技术官
「过去,安全专业知识是拥有庞大安全团队的组织才能享有的奢侈品。开源软件维护者——他们的软件支撑着全球大部分关键基础设施——历来只能自己想办法解决安全问题。开源软件构成了现代系统中绝大部分代码,包括 AI 智能体用来编写新软件的系统本身。通过让这些关键开源代码库的维护者获得新一代 AI 模型的访问权限——能够大规模主动识别和修复漏洞——Project Glasswing 提供了一条切实的路径来改变这一局面。这是 AI 增强安全如何从大团队的专属工具变成每个维护者的可靠助手的方式。」
—— Jim Zemlin,Linux 基金会 CEO
「促进金融体系的网络安全和韧性是摩根大通使命的核心,我们相信当领先机构就共同挑战携手合作时,行业是最强大的。Project Glasswing 提供了一个独特的早期机会,让我们可以按自己的标准评估下一代 AI 工具在关键基础设施防御性网络安全中的能力,同时与受尊重的技术领袖并肩作战。我们将采取严谨、独立的方式来确定如何推进以及如何提供帮助。Anthropic 的倡议体现了这一时刻所需要的前瞻性、协作性方法。」
—— Pat Opet,摩根大通首席信息安全官
「谷歌很高兴看到这一跨行业网络安全倡议的形成,并通过 Vertex AI 向参与者提供 Mythos Preview。行业在新兴安全问题上的协作一直至关重要,无论是后量子密码学、负责任的零日漏洞披露、开源软件安全,还是防御基于 AI 的攻击。我们一直相信 AI 在网络防御中既带来新挑战也带来新机遇,这就是我们构建 Big Sleep 和 CodeMender 等 AI 驱动工具来发现和修复关键软件缺陷的原因。我们将继续投资于领先的网络安全平台和以保护用户、客户、生态系统及国家安全为核心的文化。」
—— Heather Adkins,谷歌安全工程副总裁
「过去几周,我们一直在使用 Claude Mythos Preview 模型,用它来识别前一代模型完全遗漏的复杂漏洞。这不仅改变了发现隐藏漏洞的游戏规则,也意味着攻击者很快就能比以往更快地发现更多零日漏洞并开发利用代码。很明显,这些模型需要交到开源项目所有者和所有防御者手中,在攻击者获得访问权限之前发现并修复漏洞。也许更重要的是:每个人都需要为 AI 辅助的攻击者做好准备。攻击会更多、更快、更复杂。现在是全面升级网络安全体系的时候了。我们赞赏 Anthropic 与行业合作,确保这些强大能力优先服务于防御。」
—— Lee Klarich,Palo Alto Networks 首席产品与技术官
Claude Mythos Preview 强大的网络安全能力,源于其卓越的智能体编码和推理能力。以下评估结果显示,该模型在多项软件编码任务上取得了所有已知模型中的最高分。
智能体编码

推理

智能体搜索与计算机使用

注释:
- SWE-bench Verified、Pro 和 Multilingual:记忆化筛查标记了部分题目。排除可能存在记忆化的题目后,Mythos Preview 相对 Opus 4.6 的优势幅度不变。
- SWE-bench Multimodal:使用内部实现,分数与公开排行榜不可直接比较。
- Terminal-Bench 2.0:使用 Terminus-2 框架,自适应思考模式下最大努力,每个任务总预算 100 万 token,1 倍保证 / 3 倍上限资源配置,每任务 5 次尝试取平均。将超时限制提高到 4 小时并使用 Terminal-Bench 2.1 更新后,Mythos Preview 得分 92.1%。
- BrowseComp:Claude Mythos Preview 得分高于 Opus 4.6,同时 token 消耗量仅为后者的 1/4.9。
- Humanity's Last Exam:Mythos 在低努力模式下仍表现良好,可能存在一定程度的记忆化。
更多关于该模型能力、安全属性和基本特征的信息,请参阅 Claude Mythos Preview 系统卡。
我们不计划将 Claude Mythos Preview 面向公众开放,但最终目标是让用户能够安全地大规模部署 Mythos 级别的模型——不仅用于网络安全,也用于这类高能力模型将带来的众多其他价值。为此,我们需要在开发网络安全(及其他)安全防护措施方面取得进展,能够检测和阻止模型最危险的输出。我们计划在即将推出的 Claude Opus 模型中发布新的安全防护措施,使我们能够用一个不具备 Mythos Preview 同等风险水平的模型来改进和完善这些措施。
Project Glasswing 的下一步计划
今天的发布是一项长期努力的开端。要成功,需要技术行业内外的广泛参与。
Project Glasswing 合作伙伴将获得 Claude Mythos Preview 的访问权限,用于发现和修复其基础系统中的漏洞和弱点——这些系统占全球共享网络攻击面的很大比例。预计工作重点包括本地漏洞检测、二进制黑盒测试、端点加固和系统渗透测试。
Anthropic 为 Project Glasswing 及其他参与者承诺的 1 亿美元模型使用额度,将覆盖研究预览期间的大量使用。之后,Claude Mythos Preview 将以每百万输入 / 输出 token 25 美元 / 125 美元的价格向参与者提供(参与者可通过 Claude API、Amazon Bedrock、Google Cloud Vertex AI 和 Microsoft Foundry 访问该模型)。
除了模型使用额度,我们还通过 Linux 基金会向 Alpha-Omega 和 OpenSSF 捐赠了 250 万美元,向 Apache 软件基金会捐赠了 150 万美元,帮助开源软件维护者应对这一变化的格局(有兴趣的维护者可以通过 Claude for Open Source 计划申请访问)。
我们打算让这项工作在范围上持续扩展,持续数月,并尽可能多地分享经验,让其他组织也能将这些经验应用于自身安全。合作伙伴将在条件允许的范围内互相分享信息和最佳实践;90 天内,Anthropic 将公开报告我们的发现,以及可以披露的已修复漏洞和改进措施。我们还将与领先安全组织合作,制定一套关于 AI 时代安全实践演进的实用建议,可能涵盖:漏洞披露流程、软件更新流程、开源和供应链安全、软件开发生命周期与安全设计实践、受监管行业标准、分诊扩展与自动化、以及补丁自动化。
Anthropic 还一直在与美国政府官员讨论 Claude Mythos Preview 的攻防网络安全能力。保护关键基础设施是民主国家的首要国家安全优先事项——这些网络安全能力的出现,再次说明了美国及其盟友必须在 AI 技术上保持决定性领先。政府在帮助维持这一领先地位、评估和缓解 AI 模型相关国家安全风险方面有不可或缺的作用。我们愿与各级政府代表合作协助完成这些任务。
我们希望 Project Glasswing 能催生一个覆盖产业界和公共部门的更大规模努力,各方共同应对强大模型对安全影响的最大问题。我们邀请其他 AI 行业成员加入,帮助制定行业标准。从中期来看,一个独立的第三方机构——能够汇集私营和公共部门组织——可能是承载这些大规模网络安全项目后续工作的理想平台。
附注
- 该项目以玻璃翼蝶(Greta oto)命名。这个隐喻有两层含义:蝴蝶透明的翅膀让它能隐于无形,就像本文讨论的那些藏在代码中的漏洞;透明的翅膀也帮助它躲避伤害,如同我们倡导的透明方法。
- Mythos 一词源自古希腊语,意为「叙事」或「故事」:文明用来理解世界的故事体系。
- 合法工作受到这些安全防护措施影响的安全专业人士,可以申请即将推出的网络安全验证计划(Cyber Verification Program)。
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。