人类气候神话：严重威胁还是被过分炒作？人工智能安全研究所发表看法

英国的人工智能安全研究所评估了Anthropic的Claude Mythos预览，以评估其声称的重大网络安全能力，发现该AI模型可以自主执行复杂的网络攻击，成功率达到了前所未有的水平。

Claude Mythos的存在首次在三月下旬通过网站泄露披露，Anthropic确认这一强大的下一代模型能够以未曾见过的水平发现和利用网络安全漏洞。据称它在当前的网络浏览器和操作系统中发现了严重的漏洞。

与其公开发布该模型，Anthropic选择向数十家安全研究公司提供有限访问权限，以测试该模型并为其高级能力做准备。据报道，上周美国财政部长Scott Bessent和美联储主席Jerome Powell曾警告银行高管关于Claude Mythos所带来的迫在眉睫的安全威胁。

人工智能安全研究所周一发布的测试结果显示，夸大的宣传背后确实有实质性的内容。评估显示，Mythos预览在专家级抓旗任务中成功率为73%——这是任何AI模型在2025年4月之前都无法完成的挑战。

这种威胁可能证明是重大的和广泛的，尽管该技术可以用于发现和修复漏洞，而不仅仅是利用这些漏洞。对于加密基础设施运营者而言，这种日益增强的人工智能能力代表着一种新的潜在安全威胁，因为AI系统获得了独立探测和利用网络漏洞的能力。

根据人工智能安全研究所的说法，Mythos预览成为第一个完成“最后的那些人”（TLO）的AI模型，这是一种32步的企业网络攻击模拟，通常需要人类花费20小时才能完成。该模型在10次尝试中成功了3次，所有运行的平均完成步骤为32中的22步。

该模拟涵盖了从初步侦察到完全网络控制，模仿现实世界的企业入侵。表现第二好的模型Claude Opus 4.6平均只完成了16步。英国研究所指出，Mythos预览的性能随着计算资源的增加而持续提升，每次评估运行最多使用100百万个标记。

在受控评估中，模型在明确指令和提供网络访问的情况下，展示了执行多阶段攻击和发现漏洞的能力，而无需人工指导。

这一进展标志着与两年前的巨大发展，当时的AI模型还在基本的网络安全演练中挣扎。自2023年以来，一直跟踪这些能力的英国人工智能安全研究所记录了这一从初学者级任务到专家级自主攻击的快速进展。

对于加密生态系统而言，智能合约漏洞和交易所黑客攻击已每年造成数十亿美元的损失，人工智能攻击可能会加剧现有风险。去中心化金融协议通常依赖复杂的互联系统，可能特别容易受到可以全方位分析和同时攻击多个向量的自动化利用尝试。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

Decrypt的精选文章