Anthropic 正在帮助国家安全局攻击中国。它还希望每个人都暂停人工智能。

安索菲克已在国家安全局内部安排了大约六名工程师，以帮助部署Mythos——其最强大的人工智能模型——用于进攻性网络行动，金融时报周四报道。

这些工程师是前期部署的人员，为特定应用定制模型。一位消息人士告诉FT，这可能对于渗透像中国和伊朗这样的国家的网络非常有用。

这些工程师是否参与积极的操作尚未确认。已知的是：Mythos是安索菲克拒绝公开发布的相同模型，理由是滥用风险。该公司通过玻璃翼计划将其限制给经过审查的合作伙伴——这个限制性联盟包括微软、苹果和亚马逊。

安索菲克还在起诉五角大楼。今年二月末，国防部长皮特·希格赛斯将该公司指定为供应链风险——这一标签历史上仅保留给像华为这样的外国对手——在一份2亿美元合同破裂后。争执的要点是：安索菲克拒绝让国防部使用Claude进行完全自主武器或国内大规模监视。国家安全局合同豁免于这一禁令。

加利福尼亚的一名法官阻止了黑名单，作为明显的第一修正案报复。华盛顿特区的上诉法院拒绝了安索菲克在诉讼进行时停止这一行动的请求。根据FT的报道，NSA在整个过程中一直在使用Mythos。

如何阻止构建人工智能的人工智能

在NSA故事曝光的同一天，安索菲克的内部研究所发布了“当人工智能自我构建时，”，探讨了Claude在自动化其自身开发方面的进展。在这篇文章中，该公司基本上主张在人工智能军备竞赛中实施全球暂停——甚至将其比作冷战时期美国与俄罗斯之间达成的核条约。

为了理解原因，该公司提供了以下背景信息：

Claude现在编写了超过80%的合并到安索菲克生产代码库中的代码——这比2025年初Claude Code推出前的个位数有了显著上升。工程师每天发布的代码量大约是2024年的八倍。

报告的作者——安索菲克学院负责人玛丽娜·法瓦罗和联合创始人杰克·克拉克——认为这一趋势正朝着他们所称的递归自我改进方向发展：人工智能系统能够自主设计、构建和训练自己的继任者，人类在每个步骤中的角色越来越小。

在视觉表示中，研究人员展示了一条时间线，其中第一种在工作中使用人工智能的方法是人类提示计算机以获得结果，随着自动化的增加，最终由人工智能代理提示子代理直到结果达成，未涉及人类。

他们提到的最尖锐的数据点是：在四月，Claude代理被交给一个开放的人工智能安全问题——是否较弱的模型能够可靠地监督较强的模型——并被留去解决。两位人类研究人员在大约一周内恢复了两种模型之间23%的性能差距。代理们则恢复了97%，累计计算时间超过800小时。人类设定了问题。代理设计了每一个实验。这是Claude行使研究判断的第一篇已发表案例，而不仅仅是执行他人指定的任务。

这是安索菲克担心越过的界线。一旦人工智能决定哪些实验值得进行——而不仅仅是运行它们——人类在开发循环中失去了最后一个有意义的角色。今天模型中可见的小误差可能在自我改进的几代中累积，直至无人能够纠正。

他们提出的解决方案是一个可验证的全球暂停——多个前沿实验室同时停止，并进行独立验证以确认每个人实际上都停止了。安索菲克表示他们将加入其中。他们承认，单方面减速只是把领先地位交给了继续前行的人。

我们以前见过这样的电影。建立人工智能的实验室正是那些警告人工智能有多危险的实验室。然而，人工智能是十年来最有利可图的业务，因此没有人想停下来——即使是那些警告人工智能的人。

回到2023年，在人工智能研究界的100多位大牌签署了一封公开信，请求全球努力减轻人工智能发展固有的灭绝风险。在几个月之前，另一封公开信要求OpenAI因其危险性暂停对ChatGPT的进展。

2023年的公开信之后，没有人停下来。OpenAI没有。安索菲克没有。五角大楼要求将Claude从其系统中删除的最后期限将在八月到来，正好是安索菲克的首次公开募股预计将使其财务状况透明的时间。

免责声明：本文章仅代表作者个人观点，不代表本平台的立场和观点。本文章仅供信息分享，不构成对任何人的任何投资建议。用户与作者之间的任何争议，与本平台无关。如网页中刊载的文章或图片涉及侵权，请提供相关的权利证明和身份证明发送邮件到support@aicoin.com，本平台相关工作人员将会进行核查。

Anthropic 正在帮助国家安全局攻击中国。它还希望每个人都暂停人工智能。

如何阻止构建人工智能的人工智能

Decrypt的精选文章

目录

相关文章