前沿人工智能模型在智能合约漏洞利用中展示出人类水平的能力

根据周一由Anthropic发布的新数据，AI代理在过去五年中记录的主要区块链上的智能合约漏洞中，超过一半的表现与熟练的人类攻击者相匹配。

Anthropic评估了十个前沿模型，包括Llama 3、Sonnet 3.7、Opus 4、GPT-5和DeepSeek V3，使用了405个历史智能合约漏洞的数据集。这些代理对其中207个漏洞进行了有效攻击，总计模拟盗取资金达5.5亿美元。

研究结果显示，自动化系统能够多快地利用漏洞并识别开发者尚未解决的新漏洞。

这一新披露是Claude AI开发者的最新消息。上个月，Anthropic详细说明了中国黑客如何使用Claude Code发起他们所称的首个AI驱动的网络攻击。

安全专家表示，这些结果证实了许多漏洞的可获取性。

“AI已经在像Wiz Code和Apiiro这样的ASPM工具中使用，以及在标准的SAST和DAST扫描器中，”SovereignAI的首席运营官David Schwed告诉Decrypt。“这意味着恶意行为者将使用相同的技术来识别漏洞。”

Schwed表示，报告中描述的基于模型的攻击将很容易扩展，因为许多漏洞已经通过公共漏洞和暴露（CVE）或审计报告公开披露，使得AI系统可以学习并轻松尝试针对现有智能合约的攻击。

“更简单的方法是找到一个已披露的漏洞，找到分叉该项目的项目，然后尝试该漏洞，这可能没有被修补，”他说。“这一切现在都可以全天候进行，针对所有项目。即使是现在TVL较小的项目也是目标，因为为什么不呢？这具有代理性。”

为了衡量当前的能力，Anthropic将每个模型的总漏洞收入与其发布日期进行了对比，仅使用了2025年3月后被利用的34个合约。

“尽管总漏洞收入是一个不完美的指标——因为一些异常漏洞主导了总收入——我们强调它而不是攻击成功率，因为攻击者关心的是AI代理可以提取多少资金，而不是他们发现的漏洞数量或难度，”该公司写道。

Anthropic没有立即回应Decrypt的评论请求。

Anthropic表示，它在一个包含2,849个合约的零日数据集上测试了这些代理，这些合约来自于超过940万个在Binance Smart Chain上的合约。

该公司表示，Claude Sonnet 4.5和GPT-5各自发现了两个未披露的缺陷，产生了3,694美元的模拟价值，其中GPT-5的结果在API成本为3,476美元的情况下实现。Anthropic指出，所有测试都在模拟区块链的沙盒环境中进行，而不是在真实网络上。

其最强模型Claude Opus 4.5利用了17个2025年3月后的漏洞，占总模拟价值的450万美元。

该公司将模型之间的改进与工具使用、错误恢复和长期任务执行的进展联系在一起。在四代Claude模型中，令牌成本下降了70.2%。

新发现的缺陷之一涉及一个缺乏视图修饰符的公共计算器功能的代币合约，这使得代理能够反复更改内部状态变量并在去中心化交易所上出售膨胀的余额。模拟攻击产生了约2,500美元。

Schwed表示，实验中突出的这些问题“实际上只是业务逻辑缺陷”，并补充说，AI系统在给定结构和上下文时可以识别这些弱点。

“AI也可以在理解智能合约应如何运作以及详细提示如何尝试规避逻辑检查的情况下发现这些缺陷，”他说。

Anthropic表示，使代理能够利用智能合约的能力也适用于其他类型的软件，并且成本的下降将缩短部署与利用之间的时间窗口。该公司敦促开发者在其安全工作流程中采用自动化工具，以便防御性使用能够与攻击性使用同样快速地进步。

尽管Anthropic发出了警告，Schwed表示前景并非完全负面。

“我总是反对悲观的看法，并说通过适当的控制、严格的内部测试，以及实时监控和断路器，大多数这些问题都是可以避免的，”他说。“善意的行为者也可以访问相同的代理。因此，如果恶意行为者能够找到漏洞，善意的行为者也可以找到。我们必须以不同的方式思考和行动。”

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

Decrypt的精选文章